| Por
Daniel Contreras
17
de Abril de 2003
Para los científicos, la web es una aplicación
que corre sobre internet, que está definida por el protocolo
de comunicación conocido como HTTP y que mayoritariamente
usa el código HTML. Por otra parte, en términos sencillos,
la web está compuesta por todas las páginas de texto
y multimedia que podemos ver a través de nuestro navegador.
Para
completar estas definiciones y estudiar los problemas relacionados
con esta plataforma nació el Centro
de Investigación de la Web (CIW), como una iniciativa
conjunta del Departamento de Computación de la Universidad
de Chile y la Iniciativa Científica Milenio, perteneciente
al Ministerio de Desarrollo y Planificación.
“Nos interesa saber cómo se puede extraer
conocimiento desde la web. Para eso estudiamos diferentes formas
de encontrar la información y cómo podemos hacer que
estas búsquedas sean mejores y así optimizar los procesos”,
señala el Doctor Ricardo Baeza-Yates, director del CIW.
El trabajo al interior del centro ha sido divido
en las áreas de “Manejo y búsqueda de información
no tradicional”, “Minería de la web”, “Modelación
matemática de la Web”, “Extracción de
datos de la Web” y “Sistemas distribuidos y paralelismo”.
Si bien es cierto que el grueso de la investigación
que se realiza en este centro es de carácter matemático
y hecha por ingenieros, existen diversos proyectos que buscan acercar
y ampliar las actividades desde la entidad hacia la sociedad.
“Queremos hacer el primer concurso de innovación
en la web y ahora mismo estamos organizando el primer congreso latinoamericano
de la web. Además, participamos de forma activa con la Subsecretaría
de Economía para la creación de un estándar
de documento electrónico”, cuenta Baeza-Yates desde
su oficina del tercer piso del DCC (Departamento de Ciencias de
la Computación - Universidad de Chile).
El centro de investigación mantiene el espíritu,
basado en la colaboración, que caracterizó a la red
en sus comienzos. Por esta razón en este instituto participan
universidades asociadas como, la de Concepción y la de Magallanes,
además de estudiantes de universidades de México,
Colombia y Uruguay.
Parte importante en el exitoso desarrollo de la
web son los usuarios. De hecho, sin ellos este recurso no podría
existir. Si bien la teoría y la técnica es importante,
también es clave saber cómo los usuarios buscan información
y usan la web, señala Baeza-Yates. Para el experto, “la
web es uno de los medios que mayor impacto social ha tenido y que,
a pesar de lo que la gente podría creer, es uno de los medios
de comunicación mejor utilizados, porque ofrece alternativas
y muchas utilidades de todo tipo”.
El
buen buscador
Carlos Castillo tiene 26 años, es ingeniero
civil en computación y actualmente estudia un programa de
doctorado en ciencias con mención en computación en
el DCC. Su proyecto de trabajo es crear un buscador de información
en la web.
Castillo, afirma que la búsqueda de información
es un tema clave ya que la WWW crece día a día a una
velocidad impresionante y aunque la información disponible
es mucha, no sirve de nada si el usuario no la puede encontrar.
“Los motores de búsqueda mejoran día
a día y esto se debe a las investigaciones que se realizan
alrededor del mundo en centros como el CIW. Google es un ejemplo
clásico de los buenos buscadores, pero actualmente Yahoo
Search se le acerca rápidamente”, señala el
ingeniero. “Para llegar a estos niveles de calidad en las
respuestas, antes tuvo que haber una investigación heurística
con modelos matemáticos, minería de datos, procesos
y algoritmos, que entreguen una base teórica con la cual
trabajar”, afirma Castillo.
El ingeniero explica que, considerando lo anterior,
crear un buscador no es cosa de un día, para ello deben actuar
diferentes equipos de investigación hasta crear un robot
que finalmente realice las búsquedas de manera eficiente.
“Nuestro buscador –continua Castillo- analiza sitios
y lo que otros sitios dicen de él, a partir de esta comparación
crea índices de la web”.
Pero los investigadores de esta entidad no paran
de crear nuevos proyectos. “Nosotros hemos hecho el segundo
estudio de la web chilena, que intenta ser un reflejo de cómo
se comporta el crecimiento y desarrollo de las páginas en
Chile, específicamente las que están bajo el dominio
.cl o que tiene IP chilena”, señala Baeza-Yates.
Otro proyecto que ocupa a los estudiosos es el buscador
de rostros, llamado Webfaces, que permitirá a los usuarios
ingresar una foto con la cara de una persona para buscar imágenes
similares disponibles en la red.
|