domingo, julio 01, 2007

Semánticas útiles IV

Y en esta última anotación de la serie, os copio un extracto de una entrevista a Héctor García, autor del blog Kirai.net y que ahora trabaja para Technorati.jp, que apareció también en El País (cómo no) y os escribo unos últimos comentarios acerca del tema.


"Yo siempre digo que la web semántica supone pasar el marrón a los usuarios"

Yo siempre digo que la web semántica supone pasar el marrón a los demás, a los usuarios y creadores de contenidos. Actualmente, Internet es un desastre en cuanto a organización de la información, y los buscadores no hemos sido capaces de clasificarla, técnicamente hablando cada uno actúa por su cuenta y pocos creadores de páginas las marcan con herramientas que describan sus contenidos. Los buscadores acudimos a ellas y recopilamos información, palabras clave, enlaces, etc, pero sin tener mucha información real sobre el contenido. La web semántica pide a los creadores de contenidos que los marquen especificando de qué va cada página, con sistemas que luego se pueden leer automáticamente. Es una forma de pasarles la pelota a ellos y a quienes desarrollan herramientas para la creación de páginas, pero luego el trabajo volverá a los buscadores, que tendrían que ser capaces de leer toda esa información.

Y hay comentarios suyos en la entrevista en los que no estoy de acuerdo, pero este en concreto me parece genial. Y me parece que ha dado en el clavo.

No se puede pedir a los autores que etiqueten sus web, primero porque no tienen por qué y segundo por el problema de la normalización, que ya vimos en Semánticas útiles I.
No se puede, entonces, contratar a expertos que lo hagan, por lo ya comenté en Semánticas útiles II.
Y los buscadores actuales no son precisos, eso está claro. Hay que buscar otra alternativa.

¿Cuál sería? Hace mucho que dejé la carrera, y se me han olvidado muchas cosas, pero hay una que me hizo pensar y que recuerdo: las palabras no van solas. Hay cuertas combinaciones de palabras que, por su significado, por su sintaxis, por su pragmática o simplemente por costumbre, van a menudo juntas en un texto. Usemos eso. Creemos fórmulas automatizadas en los buscadores que provoquen que, cuando busquemos una palabra, busquen además esas otras que, por una razón o por otra, tienen una probabilidad alta de aparecer en ese texto-web.

(Seguro que esta opción ya ha sido investigada y descartada por los especialistas, pero oye, lo tenía que decir.)

1 comentario:

Anónimo dijo...

Tu opción no solo no ha sido descartada sino que está incluida en el motor de muchos buscadores.
El código de google, que es el ejemplo más famoso, debe ser bastante más complejo que cualquier cosa que podamos imaginarnos, pero usa todas las cosas que has ido comentando en los articulos (porque si bien no funcionan "del todo", funcionar, funcionan) y alguna más, y "puntua" una página con respecto a tu petición. Ahora mismo me acuerdo de una cosa que usaba google que en su dia fue lo que marcó la diferencia, que son los link que apuntaban a una página.

Víctor, sin ganas de pegase con blogger para que le reconozca ;)