¿Por qué la búsqueda de Google es tan rápida?
¡Una matriz tiene n fibras ópticas de 1000 M y n discos duros de calidad de servidor!
La era de las búsquedas en Internet antes de la 1.1
En los primeros días del desarrollo de Internet, había relativamente pocos sitios web y era más fácil encontrar información. Sin embargo, con el explosivo desarrollo de Internet, encontrar la información que necesitan es como encontrar una aguja en un pajar para los usuarios comunes de Internet. En ese momento, surgieron sitios web de búsqueda profesionales para satisfacer las necesidades de recuperación de información del público.
El antepasado de todos los motores de búsqueda es Archie FAQ, inventado en 1990 por Alan Entachi, Peter Deutsch y Bill Whelan en la Universidad McGill de Montreal. La World Wide Web no existía en aquella época. Archie es el primer programa que indexa automáticamente archivos de sitios web FTP anónimos en Internet, pero no es un verdadero motor de búsqueda. Archie es una lista de búsqueda de nombres de archivos FTP. El usuario debe ingresar el nombre exacto del archivo que desea buscar y Archie le indicará desde qué dirección FTP se puede descargar el archivo.
El principio de funcionamiento de Archie es muy parecido al de los motores de búsqueda actuales. Se basa en programas de script para buscar automáticamente archivos en línea y luego indexar información relacionada para que los usuarios la consulten utilizando ciertas expresiones. Inspirados por la popularidad de Archie entre los usuarios, los Servicios de Computación del Sistema de la Universidad de Nevada desarrollaron otra herramienta de búsqueda muy similar en 1993, pero esta vez la herramienta de búsqueda no sólo podía indexar archivos sino también recuperar páginas web.
En aquella época, la palabra "robot" era muy popular entre los programadores. Un robot informático es un programa de software que puede realizar una tarea sin interrupción a una velocidad que los humanos no pueden alcanzar. Debido a que los programas "robots" diseñados para recuperar información se arrastran por la web como arañas, los programas "robots" de los motores de búsqueda se denominan programas "araña". Debido a que los programas robóticos diseñados para recuperar información se arrastran en la Web como una araña, los programas robóticos de los motores de búsqueda se llaman arañas (el primer programa araña del mundo, la World Wide Web de Matthew Gray en MIT Rover, se utilizó para rastrear el crecimiento de Internet). Inicialmente, se utilizó para contar el número de servidores en Internet.
La primera herramienta del mundo para monitorear el desarrollo de Internet fue el programa "robot" desarrollado por Matthew. Gray. Se utilizó originalmente para contar el número de servidores en Internet y luego se desarrolló para recuperar nombres de dominio de sitios web.
Correspondiente Wanderer, 1993 10. En junio de este año, Martijn Koster creó Alibaba Web (. Martijn Koster anunció la disponibilidad de Alibaba Web), que es equivalente a la versión HTTP de Archie, no utiliza robots de búsqueda de Internet. Si el administrador del sitio web desea que su página web se incluya en ALIWEB, debe enviarla. La indexación de la información de cada página web es similar a lo que luego se conoció como Yahoo.
A finales de 1993 comenzaron a aparecer algunos motores de búsqueda basados en este principio. Los tres más famosos son: JumpStation en Escocia. El gusano World Wide Web de Oliver McBryan en la Universidad de Colorado (la primera instrucción de McBryan) y la araña de ingeniería de software basada en repositorios (RBSE) de la NASA. A medida que Internet creció rápidamente, se volvió cada vez más difícil recuperar todas las páginas web nuevas. Entonces, basándose en "The Wanderer" de Matthew Gray, algunos programadores mejoraron el funcionamiento de los programas "araña" tradicionales. La idea es que, dado que todas las páginas web pueden tener enlaces a otros sitios web, esto es posible. Los enlaces del sitio web Jump Station y WWW Worm solo clasifican los resultados de la búsqueda en el orden en que la herramienta de búsqueda encuentra información coincidente en la base de datos, y no hay correlación de información. RBSE es el primero en coincidir con la cadena de palabras clave. motores de clasificación de resultados de búsqueda.
En febrero de 1993, seis estudiantes de la Universidad de Stanford tuvieron la idea de analizar las relaciones entre palabras para buscar de manera más eficiente en grandes cantidades de información en Internet. se hizo famoso como concepto de búsqueda. En mayo de 2002, Excite, que fue adquirida por Infospace, detuvo su propio motor de búsqueda y cambió al metabuscador Dogpile.
En enero de 1994, el primer motor de búsqueda. Se lanzó el directorio de búsqueda y navegación EINetGalaxy (Tradewave Galaxy) Además de la búsqueda en sitios web, también admite búsquedas Gopher y Telnet.
En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, Jerry Yang. y Da David Filo*** fundó Yahoo. A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda. La eficiencia de la búsqueda ha mejorado significativamente. (Yahoo utilizará Altavista, Inktomi y Google para proporcionar servicios de motores de búsqueda).
A principios de 1994, Brian Pinkerton, un estudiante de informática de la Universidad de Washington, comenzó su pequeño proyecto "Brian Pinkerton anunció Usabilidad de rastreadores web”.
El 20 de abril de 1994, el rastreador web incluía contenido de sólo 6.000 servidores. Web Crawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda de todas las palabras de un documento. Antes, los usuarios sólo podían buscar por URL y resumen, a menudo a partir de anotaciones humanas o programas que extraían automáticamente las primeras 100 palabras de texto. (Más tarde, AOL y excite adquirieron sucesivamente los rastreadores web, y ahora utilizan metabuscadores como Excite Dogpile).
1.2 Era de búsqueda en Internet
El primer motor de búsqueda moderno apareció en julio Luna de 1994. En ese momento, Michael Mauldin conectó el programa araña de John Leavitt a su programa de indexación y creó Lycos, que ahora es ampliamente conocido. En abril del mismo año, dos estudiantes de doctorado de la Universidad de Stanford, David Filo y el chino-estadounidense Gerry Yang, cofundaron el índice de súper directorio Yahoo e introdujeron con éxito el concepto de motor de búsqueda Profundamente arraigado en los corazones de las personas. Desde entonces, los motores de búsqueda han entrado en un período de rápido desarrollo. Actualmente existen cientos de motores de búsqueda conocidos en Internet y la cantidad de información que recuperan no es la misma que antes. Por ejemplo, Google, que ha estado en el punto de mira recientemente, ¡tiene 3 mil millones de páginas almacenadas en su base de datos!
Con la rápida expansión de Internet, un motor de búsqueda ya no puede adaptarse solo a la situación actual del mercado, por lo que ahora existe una división del trabajo y cooperación entre los motores de búsqueda, y existen tecnologías de motores de búsqueda profesionales. y buscar proveedores de servicios de bases de datos. Al igual que Inktomi extranjero, no es un motor de búsqueda dirigido directamente a los usuarios, sino que proporciona servicios de búsqueda web de texto completo a otros motores de búsqueda, incluidos Overture (anteriormente GoTo), LookSmart, MSN, HotBot y otros motores de búsqueda. Baidu de China también entra en esta categoría, y Sohu y Sina utilizan su tecnología. Entonces, en ese sentido, son motores de búsqueda para motores de búsqueda.
Lycos (Centro de traducción automática Lycos de la Universidad Carnegie Mellon) es otro avance importante en la historia de los motores de búsqueda. Michael Mauldin de la Universidad Carnegie Mellon conectó el programa araña de John Leavitt con su programa de indexación y creó Lycos. El 20 de julio de 1994, se lanzó oficialmente Lycos con un volumen de datos de 54.000. Además de la clasificación por relevancia, Lycos también proporciona coincidencias de prefijos y restricciones de similitud de caracteres. Lycos fue el primero en utilizar el resumen automático de páginas web en los resultados de búsqueda. La mayor ventaja es que la cantidad de datos supera con creces la de otros motores de búsqueda: 65438 + agosto 0994-394.000 documentos; enero 1995-15.000 documentos; de 6.000 millones de documentos. (Nota: en abril de 1999, Lycos detuvo su propia araña y recurrió a Fast para proporcionar servicios de motor de búsqueda).
Infoseek es otro motor de búsqueda importante. Aunque la empresa afirma haber sido fundada en 1994, su motor de búsqueda no llegó al público hasta finales de año. Al principio, Infoseek era sólo un motor de búsqueda poco conocido, justo detrás de Yahoo. En cuanto a Lycos, no hay nada único e innovador. Pero su evolución y posterior reputación demuestran que no siempre importa ser el primero en subir al escenario. La interfaz fácil de usar de Infoseek y numerosos servicios adicionales (como seguimiento de ups, noticias, directorios, etc.) lo hacen cada vez más famoso. Junio de 1995 + febrero de 65438 El acuerdo estratégico con Netscape lo convierte en un potente motor de búsqueda: el servicio de búsqueda de Infoseek aparece cuando un usuario hace clic en el botón de búsqueda del navegador Netscape, mientras que Yahoo! proporcionar este servicio. (Nota: Infoseek se hizo famoso más tarde por su relevancia. En febrero de 2001, Infoseek abandonó su propio motor de búsqueda y comenzó a utilizar los resultados de búsqueda de Overture).
En 1995, surgió una nueva forma de motor de búsqueda: una revisión de Metabuscadores. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable de la conversión y el procesamiento antes de enviarla a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de las consultas devueltos por los motores de búsqueda independientes se recopilan y procesan antes de devolverlos al sitio. usuario. El primer metabuscador fue Metacrawler de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington. Los metabuscadores suenan bien en concepto, pero los resultados de búsqueda siempre son insatisfactorios, por lo que ningún metabuscador ha tenido nunca una posición fuerte.
Altavista de DEC (algunos internautas necesitan acceder a través de p-roxy desde el verano de 2001, qbseach busca AltaVista, no hay p-roxy disponible y sólo puede mostrar la página de inicio de resultados de búsqueda) fue solo apareció un recién llegado hasta 1995 (manuscrito de noticias beta pública de AltaVista). Pero una gran cantidad de funciones innovadoras alcanzaron rápidamente la cima de los motores de búsqueda de la época. La ventaja más destacada de Altavista es la velocidad. Las otras características nuevas de Altavista cambian para siempre la definición de los motores de búsqueda. AltaVista es el primer motor de búsqueda que admite búsquedas en lenguaje natural. AltaVista es el primer motor de búsqueda que implementa una sintaxis de búsqueda avanzada (como y, O, NO, etc.).
).Los usuarios pueden utilizar AltaVista para buscar grupos de noticias y recuperar artículos de Internet, así como buscar palabras en nombres de imágenes, títulos, subprogramas Java y objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a una base de datos de índice web, y puede iniciarse en 24 horas. Una de las novedades más interesantes de AltaVista es la búsqueda de todos los sitios web con enlaces URL. AltaVista también ha realizado muchas innovaciones en la interfaz orientada al usuario. Coloca "sugerencias" en el área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor su estilo de búsqueda. Estos consejos se actualizan con tanta frecuencia que después de algunas búsquedas, los usuarios verán muchas características interesantes que tal vez nunca supieron que existían. Esta serie de características han sido gradualmente adoptadas ampliamente por otros motores de búsqueda.
En 1997, AltaVista lanzó LiveTopics, un sistema de presentación gráfica para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda.
Luego está HotBot. El 26 de septiembre de 1995, el asistente de informática Eric Brewer y el estudiante de doctorado de UC Berkeley Paul Gauthier fundaron Inktomi (UC Berkeley anuncia Inktomi). El 20 de mayo de 1996 se fundó la empresa Inktomi y apareció ante el mundo un potente HotBot. Afirma ser capaz de rastrear más de 65438+100 millones de páginas de índice cada día, por lo que hay mucho más contenido nuevo que otros motores de búsqueda. HotBot también utiliza cookies para almacenar las preferencias de búsqueda personales de los usuarios. (Hotbot fue uno de los motores de búsqueda más populares en los años siguientes y fue adquirido por Lycos)
Northernlight se fundó en Cambridge, Massachusetts, en septiembre de 1995. En agosto de 1997, apareció oficialmente el motor de búsqueda Northernlight. Solía ser uno de los motores de búsqueda más grandes en términos de base de datos. No tiene palabras vacías. Tiene excelentes noticias de actualidad, una colección especial de más de 7100 publicaciones y una buena sintaxis de búsqueda avanzada. Es el primero en admitir la clasificación automática simple de los resultados de búsqueda. (El 5438 de junio + 65438 de octubre + 6 de junio de 2002, el motor de búsqueda Northern Light fue cerrado y posteriormente adquirido por Divine. Sin embargo, en Nlresearch, se selecciona "Sólo World Wide Web" y el motor de búsqueda Northernlight todavía se puede utilizar. )
Antes de octubre de 1998, Google era sólo un pequeño proyecto de la Universidad de Stanford. En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio google.com el 15 de septiembre de 1997. A finales de 1997, con la participación de Sergey Brin, Scott Hassan y Alan Strömberg, Bach Rub comenzó a ofrecer demostraciones. En febrero de 1999, Google completó la transición de la versión Alpha a la versión Beta. Google considera el 27 de septiembre de 1998 como su cumpleaños.
Las innovaciones de Google en búsqueda integral, soporte multilingüe, interfaz de usuario y otras funciones, como Pagerank, resúmenes dinámicos, instantáneas de páginas web, actualización diaria, soporte de formatos de múltiples documentos, búsqueda en diccionario de mapas, etc. ., son una vez más Como Altavista cambió la definición de buscador para siempre.
Antes de mediados de 2000, Google era muy apreciado por su precisión de búsqueda, pero debido a que su base de datos no era tan grande como la de otros motores de búsqueda y carecía de sintaxis de búsqueda avanzada, su valor de uso no era muy alto y su promoción era no rápido. No fue hasta que se actualizó la base de datos a mediados de 2000 que Yahoo! la seleccionó como motor de búsqueda.
Fast (Alltheweb) se fundó en 1997 como resultado de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU). En mayo de 1999, lanzó su propio motor de búsqueda AllTheWeb. El objetivo de Fast es ser el motor de búsqueda más grande y rápido del mundo, y ha estado cerca en los últimos años. Fast (Alltheweb) puede clasificar automáticamente páginas web según ODP, admite búsquedas en Flash y PDF, admite búsquedas en varios idiomas y también proporciona búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, y tiene funciones de búsqueda avanzadas extremadamente poderosas.
Teoma se originó a partir de un proyecto de la Universidad de Rutgers en 1998. El profesor Apostolos Gerasoulis dirigió al profesor chino Tao Yang y a otros para crear Teoma en Piscataway, Nueva Jersey. Debutó en la primavera de 2001, fue adquirido por Ask Jeeves en septiembre de 2001 y fue relanzado en abril de 2002. La base de datos de Teoma aún es pequeña, pero tiene dos características brillantes: admite clasificación automática similar a Refine y también proporciona recursos de directorio de enlaces profesionales;
Wisenut fue fundada por el coreano Yin Rujie. La versión beta se lanzó en la primavera de 2001 y la versión oficial se lanzó el 5 de septiembre de 2006 54 38+0. En abril de 2002, fue adquirida por el proveedor de directorios clasificados looksmart. Wisenut también tiene dos funciones inteligentes: WiseGuide contiene clasificación automática similar y términos de búsqueda relacionados con vista previa de resultados de búsqueda;
Gigablast fue fundada por el ex ingeniero de Infoseek Matt Wells. La versión pre-Beta se mostró en marzo de 2002 y la versión Beta se lanzó el 21 de julio de 2002. La base de datos de Gigablast es actualmente pequeña, pero también hay instantáneas web disponibles. Una característica especial es la indexación de páginas web en tiempo real, de modo que se puedan buscar en sus páginas web tan pronto como se envíen (nota: la función de panecillo de carne para spammers está temporalmente desactivada).
Openfind se estableció en 1998, 65438+Octubre. Su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. Al principio, Openfind era sólo un motor de búsqueda chino. Alguna vez fue el mejor motor de búsqueda chino. En su apogeo, proporcionó motores de búsqueda chinos para los tres famosos portales Sina, Qimo y Yahoo. Sin embargo, después del año 2000, el mercado se dividió gradualmente entre Baidu y Google. En junio de 2002, Openfind relanzó la versión beta del motor de búsqueda Openfind basado en el Proyecto GAIS30, lanzó PolyRankTM y anunció que había acumulado 3.500 millones de páginas web y había comenzado a ingresar al campo de la búsqueda en inglés. Desde entonces, las actualizaciones tecnológicas se han acelerado significativamente.
Skynet de la Universidad de Pekín es el resultado de la investigación del Proyecto Nacional Clave de Ciencia y Tecnología del Noveno Plan Quinquenal "Codificación china-inglés y descubrimiento de información distribuida en chino". Desarrollado por el Laboratorio de Investigación de Redes y Sistemas Distribuidos del Departamento de Ciencias de la Computación de la Universidad de Pekín, se prestó oficialmente sus servicios en CERNET el 29 de junio de 1997. A principios de 2000, se estableció el nuevo grupo de investigación del motor de búsqueda Skynet, financiado por el National 973 Proyecto clave de planificación del desarrollo de la investigación básica El fondo financió el desarrollo e incluyó aproximadamente 60 millones de páginas web. Aprovechando la red educativa, dispone de una potente función de búsqueda ftp.
En junio de 5438 + octubre de 2000, Robin Li, el inventor de la patente Hyperchain Analysis y ex ingeniero senior de Infoseek, y su amigo Xu Yong (Ph.D. de la Universidad de California, Berkeley) fundaron Baidu. en Zhongguancun, Beijing. La versión beta del motor de búsqueda Baidu.com se lanzó en agosto de 2001 (Baidu solo proporciona motores de búsqueda para otros portales como Sohu, Sina, Tom, etc.), y el motor de búsqueda Baidu se lanzó oficialmente el 22 de octubre de 2001. Aunque Baidu sólo ofrece búsquedas en chino, actualmente contiene más de 90 millones de páginas web chinas y puede ser la base de datos china más grande. Otras funciones del motor de búsqueda de Baidu incluyen: instantánea de la página web, vista previa de la página web/vista previa de todas las páginas web, términos de búsqueda relacionados, consejos para corregir errores tipográficos, búsqueda de noticias, búsqueda Flash y búsqueda de Information Express. Después del lanzamiento del proyecto Blitzen en marzo de 2002, las actualizaciones tecnológicas se aceleraron significativamente.
1.3 Hitos de los motores de búsqueda
En 1990, los estudiantes de la Universidad McGill Alan Entachi, Peter Deutsch y Bill Whelan inventaron Archie FAQ.
En 1993, los Servicios de Computación del Sistema de la Universidad de Nevada desarrollaron otra herramienta de búsqueda que era muy similar a Archie. Sin embargo, además de indexar archivos, la herramienta de búsqueda en ese momento también podía buscar páginas web.
En 1993, Matthew Gray desarrolló Web Rover, el primer programa "robot" del mundo para monitorear el crecimiento de Internet.
En junio de 1993, Martin Koster creó ALIWEB, que es la versión HTTP de Archie.
A finales de 1993, comenzaron a aparecer uno tras otro algunos motores de búsqueda basados en este principio, entre los que Jump Station, World Wide Web Worm y Knowledge Base-Based Software Engineering (RBSE) Spider fueron los más populares. famoso.
En enero de 1994, se lanzó el primer directorio con capacidad de búsqueda y navegación, EINetGalaxy (Tradewave Galaxy). Además de la búsqueda en sitios web, también se admiten búsquedas Gopher y Telnet.
A principios de 1994, Brian Pinkerton, un estudiante de informática de la Universidad de Washington, inició su pequeño proyecto "Brian Pinkerton anuncia la disponibilidad de rastreadores web". El 20 de abril de 1994 aparecieron oficialmente los rastreadores web.
En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, Jerry Yang (Yang Zhiyuan) y David Ferro***, fundaron Yahoo. A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda.
En julio de 1994, Michael Mauldin conectó el programa araña de John Leavitt a su programa de indexación y creó Lycos, como se lo conoce ahora. A finales de 1996, AOL adquirió el 20% de las acciones de Excite y, naturalmente, Excite proporcionó el motor de búsqueda en línea estadounidense.
En 1995, apareció una nueva forma de motor de búsqueda: una revisión de los metabuscadores. El primer metabuscador fue Metacrawler de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington.
El 26 de septiembre de 1995, el asistente de informática Eric Brewer y el estudiante de doctorado de UC Berkeley Paul Gauthier fundaron Inktomi (UC Berkeley anuncia Inktomi). El 20 de mayo de 1996 se fundó la empresa Inktomi y apareció ante el mundo un potente HotBot.
En septiembre de 1995, se estableció Northern Lights Corporation en Cambridge, Massachusetts. En agosto de 1997 apareció oficialmente el motor de búsqueda Northernlight. Solía ser uno de los motores de búsqueda más grandes en términos de base de datos. No tiene palabras vacías. Tiene excelentes noticias de actualidad, una colección especial de más de 7100 publicaciones y una buena sintaxis de búsqueda avanzada. Es el primero en admitir la clasificación automática simple de los resultados de búsqueda.
En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio google.com el 15 de septiembre de 1997. A finales de 1997, con la participación de Sergey Brin, Scott Hassan y Alan Strömberg, Bach Rub comenzó a ofrecer demostraciones. En febrero de 1999, Google completó la transición de la versión Alpha a la versión Beta. Google considera el 27 de septiembre de 1998 como su cumpleaños.
Fast (Alltheweb) se fundó en 1997 como resultado de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU). En mayo de 1999, lanzó su propio motor de búsqueda AllTheWeb.
En 1998, el profesor Apostolos Gerasoulis de la Universidad de Rutgers llevó al profesor Tao Yang y a otros a establecer Teoma en Piscataway, Nueva Jersey. Debutó en la primavera de 2006 y fue adquirido por Ask Jeeves en septiembre de 2006. Lanzado nuevamente. en abril.
En 1998, se estableció Openfind. Su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. En junio de 2002, Openfind relanzó la versión beta del motor de búsqueda Openfind basado en el Proyecto GAIS30.
1997 10 El 29 de octubre, como resultado de la investigación del proyecto nacional clave de ciencia y tecnología "Codificación china-inglés y descubrimiento de información distribuida", el Laboratorio de Investigación de Redes y Sistemas Distribuidos desarrolló Skynet de la Universidad de Pekín. del Departamento de Ciencias de la Computación de la Universidad de Pekín Proporciona oficialmente servicios en CERNET. A principios de 2000, el nuevo equipo de investigación del motor de búsqueda Skynet fue establecido, financiado y desarrollado por el Fondo Nacional del Proyecto de Planificación del Desarrollo de la Investigación Básica Clave 973, e incluía aproximadamente 60 millones de páginas web. Aprovechando la red educativa, dispone de una potente función de búsqueda ftp.
En junio de 5438 + octubre de 2000, Robin Li, el inventor de la patente Hyperchain Analysis y ex ingeniero senior de Infoseek, y su amigo Xu Yong (Ph.D. de la Universidad de California, Berkeley) fundaron Baidu. en Zhongguancun, Beijing. La versión beta del motor de búsqueda Baidu.com se lanzó en agosto de 2001 (Baidu solo proporciona motores de búsqueda para otros portales como Sohu, Sina, Tom, etc.), y el motor de búsqueda Baidu se lanzó oficialmente el 22 de octubre de 2001.
En la primavera de 2001, el coreano Yin Rujie fundó Wisenut y lanzó una versión de prueba. La versión oficial se lanzó el 5 de septiembre de 2001. En abril de 2002, fue adquirida por el proveedor de directorios clasificados looksmart.
El 1 de mayo de 2002, el imperio de Internet AOL firmó un contrato con Google para adoptar completamente el motor de búsqueda de Google y mostrar los resultados de clasificación de todos los sitios web vendidos por Google.
El 24 de febrero de 2002, 65438+ Yahoo dijo que había acordado adquirir la empresa de software de búsqueda Inktomi por aproximadamente 235 millones de dólares.
En junio de 5438 + octubre de 65438 + agosto de 2003, Google adquirió el desarrollador de software de publicación en línea PyraLabs, que es el equipo de desarrollo del sitio web de blogs Blogger.com.
El 19 de febrero de 2003, Overture Service declaró que planeaba adquirir el portal AtaVista de CMGI por 1,4 millones de dólares en efectivo y acciones.
El 26 de febrero de 2003, Overture acordó adquirir el departamento de búsqueda web de la empresa noruega Fast Search and Transfer por 6.543,8 millones de dólares.
El 15 de abril de 2003, Sina formó una alianza estratégica con China Search Alliance. Hasta ahora, cientos de sitios web en China han formado una alianza de búsqueda para hacer frente a la enorme presión después de que el gigante internacional Google ingresó al mercado interno.
El 21 de abril de 2003, AskJeeves, el segundo mayor proveedor de motores de búsqueda de Internet, anunció que actualizaría su sitio web Ask.com. Askjeeves es el segundo motor de búsqueda más grande después de Google y la quinta base de búsqueda más grande en Internet (Google, Yahoo, Microsoft, AOL, AskJeeves).
El 18 de junio de 2003, Microsoft declaró que estaba intensificando la investigación y el desarrollo de una nueva tecnología de motor de búsqueda en Internet, incluida la prueba de un prototipo con funciones más avanzadas.
El 13 de julio de 2003, Baidu lanzó dos funciones de búsqueda principales: búsqueda de imágenes y búsqueda de noticias para generar tráfico de búsqueda. Al mismo tiempo, complementada con la lista de búsqueda de Baidu, la búsqueda y evaluación de información de Baidu son más destacadas.
El 15 de julio de 2003, Yahoo, la mayor empresa de Internet del mundo, anunció que adquiriría Overture, un competidor de los servicios de búsqueda en línea, por 16.300 millones de dólares para obtener una ventaja en la competencia con Google. .