Desvariando semánticamente
Hoy vengo con cuentos chinos. Hace unos días estuve conversando con Hong, una chica de esa nacionalidad que me contó un poco los fundamentos de su lengua. Entre todas sus explicaciones hubo una que me llamó mucho la atención y sobre la que he estado pensado un poco. Voy a tratar de exponer claramente las ideas que he sacado de ello, pero os aviso de antemano que puede ser que mis conclusiones sean más que evidentes para muchos de vosotros. O sea, que si todo lo que digo ya existe o está más que superado, os pido por favor bibliografía que me permita acercarme más a todo ello. Sigo.
Hay veces en que para representar dos conceptos diferentes se usa un mismo ideograma. Por ejemplo, en español la palabra gato puede usarse para referir un animal o una herramienta. Usemos este mismo ejemplo y digamos que en chino, la palabra gato se representa con el ideograma A. Entonces, si vemos u oimos A sólo podemos saber de qué tipo de gato se habla por el contexto. Pues bien, en chino según parece esto no siempre es tan evidente, así que en algunos casos introducen un nuevo ideograma que añade carga semántica. Para este caso, podríamos usar X como marca del grupo semántico de los animales y Z como marca de las herramientas, con lo cual la cosa quedaría así:
- animal gato: XA
- herramienta gato: ZA
De esta manera, ya no es necesario el contexto para saber a qué nos referimos cuando decimos gato. Muy bien, gracias, gracias, no es necesario que aplaudais tanto
Bueno, pues ahora me voy al tema de la web semántica y me pregunto: esto no podría adaptarse para que los buscadores sepan qué resultados quiero cuando busco la palabra gato? Se trataría de programar a los robots para que, cuando realizan la indexación de los recursos, separen en su base de datos los conceptos según lo que realmente designan en cada documento. Es decir, si la palabra que nos ocupa aparece en una tienda de animales, en el índice aparece como Xgato, pero si aparece en la web de una ferretería sale como Zgato. Me explico?
Claro que para conseguir esto, que sin duda aportaría mucha más precisión a las búsquedas, hay que conseguir que el buscador comprenda el contexto de cada documento en el momento de la indexación y en el de la consulta (en todo esto sí que se está trabajando), con lo cual no estoy seguro de que lo que yo propongo, que es como un paso intermedio, sea realmente necesario. Así pues, ahora que ya me he despojado de esta idea que vagaba por mi cabeza, alguién puede aclararme algo?
Ultima hora: En Nosolousabilidad.com acaban de publicar el artículo Web Semántica: El papel del Arquitecto de la Información, que añade un poco más de luz a mi post de ayer.




Javier Leiva (<a href=”http://es.geocities.com/jlag76)”>http://es.geocities.com/jlag76)</a> @ 05/02/2003 23:23:
Hola todos. A partir de ahora este blog incorpora el sistema de comentarios para los posts (gracias Mauricio). Veremos si funciona y sirve para enriquecernos un poco a todos. Venga, es vuestro, adelante.
Feedback-to-Feedback
mauricio () @ 05/04/2003 01:38:
Felicitaciones por la iniciativa Javi
Realmente era necesario en este maravilloso weblog…
Saludos!!!
Mauri
Feedback-to-Feedback
Bib. desord vía Yusef Hassan (<a href=”http://es.geocities.com/jlag76)”>http://es.geocities.com/jlag76)</a> @ 05/04/2003 09:01:
Muchas gracias Mauricio. Creo que esto de los comentarios le va a añadir interés, como puedes ver a continuación:
En el próximo comment (no funcionan muy bien y creo que igual es porque no acepta mensajes tan largos) reproduzco un mensaje que me ha mandado Yusef Hassan (<a href=”http://www.nosolousabilidad.com/yusef)”>http://www.nosolousabilidad.com/yusef)</a> que sirve como excelente complemento para todo aquello que yo no supe explicar en mi post.
Feedback-to-Feedback
Bib. desord vía Yusef Hassan (<a href=”http://es.geocities.com/jlag76)”>http://es.geocities.com/jlag76)</a> @ 05/04/2003 09:01:
“…aunque parezca extraño, no es lo mismo hablar de la semántica en la Web que de Web Semántica. Por una razón muy simple, la Web Semántica debería denominarse “Web MetaSemántica”. Su objetivo no es asignar semántica a cada palabra que aparece en un hiperdocumento, sino asignar metasemántica al hiperdocumento en sí, o a las diferentes partes del hiperdocumento. Es metasemántica porque, al margen de que a un agente inteligente le indiquemos quién es el autor del documento, a quién conoce, en qué trabaja, qué parte representan las conclusiones del texto, etc… el hiperdocumento en sí
tiene una semántica propia (qué significa cada uno de los términos, expresiones y frases del documento) que el agente inteligente, y por lo menos por medio de
técnicas de “Web Semántica”, no va a “entender”. Lo que tu propones es un sistema de desambigüedad de términos, y tiene más que ver con la semántica de un texto que con su metasemántica.”
Muy clarificador. Gracias Yusef!
Feedback-to-Feedback
fsiles (<a href=”http://www.barbol.com)”>http://www.barbol.com)</a> @ 05/04/2003 15:45:
ergh ke peich, pero si hay comentarios, fantástico, ahora sí que ¡te vas a ca…!
Feedback-to-Feedback
Bibliotecario desordenado (<a href=”http://es.geocities.com/jlag76)”>http://es.geocities.com/jlag76)</a> @ 05/04/2003 16:22:
Ayayay Fernando, no seas demasiado malo conmigo
Feedback-to-Feedback
mauricio () @ 05/06/2003 11:49:
Javi… por lo que interpreto de lo que planteas… sería un elemento booleano que favoreciera la calidad del resultado: herramienta gato , animal gato…
En el caso de google, cuando buscas por lenguaje ya estás contextualizando… especificando… Creo que agregar (X)gato podría no ser una tarea complicada para quienes generan elementos booleanos…siempre y cuando se seleccione también el idioma…
¿se entendio?? saluditos
Feedback-to-Feedback
Bibliotecario desordenado (<a href=”http://es.geocities.com/jlag76)”>http://es.geocities.com/jlag76)</a> @ 05/06/2003 18:10:
Yo habia pensado en un indice donde las ocurrencias se desdoblaran para deshacer toda posible homonimia. Es decir, organizar ese índice por facetas de manera que al recuperar se eliminara el ruido. Demasiado complicado, imagino, y ademas luego habria que conseguir que eso fuera buscable de manera sencilla (para el usuario y para el sistema).
Comment by Anonymous — September 1, 2003 @ 2:35 pm
creo que algo parecido a lo que comentas se hace en http://www.getty-images.com, cuando buscas una imagen y pones por ejemplo: connect, te dan la opción de seleccionar por el concepto de conexión entre personas o conexión tipo internet y tal… ¡interesante!
Comment by maría — January 6, 2005 @ 5:18 pm
no se entiende nada
Comment by nadie en lo absoluto — October 11, 2005 @ 12:17 am