Red de conocimiento del abogados - Cuestiones jurídicas del divorcio - ¿Cómo ajustar la estrategia de búsqueda para lograr resultados de búsqueda satisfactorios?

¿Cómo ajustar la estrategia de búsqueda para lograr resultados de búsqueda satisfactorios?

Métodos y estrategias básicos de recuperación de documentos por computadora

La recuperación de información por computadora es esencialmente un proceso en el que la computadora compara y relaciona la estrategia de recuperación de entrada con los identificadores de características del documento y sus relaciones de combinación lógica almacenadas en el sistema. Debido a la incertidumbre de los propios requisitos de información, la falta de comprensión completa de las características del documento en la base de datos y algunas limitaciones de las funciones del sistema, el efecto de recuperación se verá afectado en diversos grados. Sin embargo, siempre que se sigan ciertos pasos de recuperación y se formule una buena estrategia de recuperación, se puede reducir el impacto de varios factores desfavorables y los signos de interrogación de recuperación pueden ser lo más consistentes posible con las necesidades de información y el sistema de recuperación, de modo que el sistema puede recuperar resultados que satisfagan las necesidades de los usuarios.

1. Pasos de la búsqueda

(1) Aclarar las necesidades de información y el propósito de la recuperación.

La demanda de información es una demanda objetiva o subjetiva de información diversa de inteligencia. Esta demanda es el punto de partida para que las personas soliciten información de inteligencia y también es la base para seleccionar bases de datos, determinar estrategias de recuperación y evaluar los efectos de la recuperación en la recuperación de información en línea. Los diferentes tipos de temas tienen diferentes necesidades de información. Por ejemplo, al solicitar invenciones, solicitar premios por logros, evaluar proyectos, etc., a menudo es necesario recopilar información bibliográfica exhaustiva sobre un tema determinado. Este tipo de preguntas tienen características de censo y trazabilidad, y deben basarse en una búsqueda integral de temas clave de investigación que resuelvan un problema específico en la investigación y producción científica, muchas veces solo requieren que la información detectada sea útil para su propia investigación y búsqueda; No es necesario que la variedad de literatura revisada sea amplia. Por tanto, este tipo de preguntas requieren una investigación precisa.

¿Cómo analizar correctamente las necesidades de información? También podríamos analizarlo desde dos aspectos: la forma y el contenido de las necesidades de información. Las preguntas que requieren aclarar la forma de la información incluyen:

①Aclarar el propósito de la búsqueda. ¿La búsqueda es para informar resultados o para conocer los últimos avances del tema? , formulando así una estrategia de recuperación que cumpla con los requisitos de tasa de recuperación o tasa de precisión.

(2) Aclarar la cantidad de literatura requerida. Establecer un límite superior en la cantidad de documentos requeridos es un parámetro importante para determinar futuras estrategias de búsqueda y controlar los costos de búsqueda. Al mismo tiempo, es necesario estimar la cantidad de literatura relevante que puede existir en el tema de búsqueda.

(3) También es importante determinar el idioma, rango de edad, tipo, autor u otras características de apariencia de los documentos requeridos, lo cual también es importante para limitar el alcance de la búsqueda.

Las principales cuestiones que deben aclararse sobre el contenido de la información son:

(1) Es muy importante identificar claramente el ámbito temático principal involucrado en el contenido temático de recuperación, que Es muy importante para seleccionar una base de datos adecuada en el futuro.

② Analizar el contenido principal del tema de recuperación y expresar estos requisitos de contenido en lenguaje natural es una parte importante de la recuperación en línea.

(2) Seleccione la base de datos y determine el método de búsqueda.

Después de analizar las necesidades de información, podemos seleccionar una base de datos adecuada en función de condiciones conocidas, lo que implica la selección de un sistema de recuperación. Si desea buscar documentos de patente extranjeros, puede buscar en la base de datos nacional GWZL del sistema BDSIRS. Sin embargo, sus métodos de búsqueda y cobertura de los últimos documentos de patentes no son tan buenos como los de la base de datos WPI del sistema estadounidense DIALOG. Cuando los requisitos de recuperación son elevados, todavía se utiliza con frecuencia el sistema de diálogo estadounidense.

Al elegir una base de datos, primero debe comprender:

(1) El área temática cubierta por la información recopilada en la base de datos;

②Los tipos de documentos incluido, es mejor comprender mejor las principales fuentes de la literatura;

③El rango de tiempo incluido;

(4) El índice básico y el índice auxiliar de la base de datos y los métodos de búsqueda. y marcas de búsqueda proporcionadas Características;

⑤ Costo de recuperación de la base de datos, incluido el costo del tiempo de la máquina y el costo de impresión de cada registro.

Una vez seleccionada la base de datos, se determinan los métodos de búsqueda que proporciona. Se pueden determinar uno o varios métodos de búsqueda en función de condiciones conocidas. Debido a la gran capacidad de almacenamiento de las computadoras y la rápida velocidad de computación, la indexación se puede establecer mediante una comparación de múltiples campos. No solo puede buscar desde palabras de tema, números de clasificación y autores comúnmente utilizados en la recuperación manual, sino también desde palabras libres. de artículos, tipos de documentos y nombres de revistas, también puede utilizar una combinación de múltiples métodos para realizar la recuperación cruzada, que está fuera del alcance de la recuperación manual.

(3) Determinar el grupo conceptual y el identificador de búsqueda del tema.

Después de comprender las necesidades de información y el contenido principal del tema de búsqueda, determinar el grupo conceptual y el identificador de búsqueda es un paso importante. Cuando el tema de recuperación contiene contenido de tema complejo, varios grupos de conceptos que componen el contenido del tema deben definirse claramente y se deben formar ciertos conceptos compuestos o relaciones conceptuales a través de ciertas combinaciones lógicas para expresar las necesidades de información del usuario.

Una vez determinado el plano conceptual del tema, se debe convertir dicho plano conceptual en el correspondiente identificador de búsqueda reconocido por el sistema. La representación del identificador de recuperación debe cumplir dos requisitos: primero, relevancia, es decir, el identificador de recuperación refleja las necesidades de información; segundo, coincidencia, es decir, el identificador de recuperación es coherente con el identificador de característica de almacenamiento del sistema de recuperación.

Las etiquetas de búsqueda generalmente tienen las siguientes tres formas:

① Palabras estándar: selecciona palabras o frases estándar del tesauro o tesauro de la base de datos a buscar, porque el tesauro es un Idioma de búsqueda que se debe seguir para la indexación y recuperación de bases de datos. Para que la identificación de las preguntas de recuperación sea coherente con la identificación de las características del documento y obtener los mejores resultados de recuperación, primero debemos seleccionar palabras estandarizadas.

②Código estandarizado: el código de índice es la unidad de índice especificada por el sistema de base de datos para ciertas categorías de temas o conceptos de temas.

Esta unidad tiene buena especificidad y es un reconocimiento de características de documentos con buen efecto de recuperación. Como el número de Clasificación Internacional de Patentes IC =, el código de producto PC = de la base de datos PTS, el código industrial estándar SC = y así sucesivamente.

③Palabra libre: la búsqueda de palabras gratuita puede aprovechar al máximo la función de búsqueda de texto completo del sistema. La selección de palabras o códigos estándar requiere el uso de un diccionario de sinónimos o una tabla de clasificación para convertir del lenguaje natural al lenguaje estándar. Las diferentes ideas entre el buscador y el buscador también afectarán el efecto de recuperación. En este momento, utilizar palabras libres para buscar títulos, resúmenes e incluso textos completos muestra algunas ventajas. El lenguaje libre es directo y conciso, y es un método común aceptable para el personal científico y técnico.

(4) Formular tipos de preguntas de búsqueda y determinar procedimientos de búsqueda específicos.

La expresión de pregunta de recuperación se refiere a la expresión lógica utilizada para expresar las preguntas de recuperación del usuario en la recuperación de información por computadora. Consta de términos de búsqueda, varios operadores lógicos booleanos, operadores posicionales y otras combinaciones y conexiones especificadas por el sistema. Composición de símbolos. En cierto sentido, el estilo de recuperación es la encarnación concreta de la estrategia de recuperación, y su calidad estará relacionada con el éxito o el fracaso de la estrategia de recuperación.

Una vez determinadas las etiquetas de búsqueda, el siguiente paso es conectar todas las etiquetas de búsqueda en una determinada relación de combinación para formar una pregunta de búsqueda y expresar varias relaciones conceptuales complejas para expresar con precisión las necesidades de información. Preste atención al uso de varios operadores lógicos, operadores posicionales y operadores de truncamiento, como la precisión y el orden de los operadores posicionales, así como los requisitos de calificación y el orden de entrada de cada término de búsqueda, y la modificación de las fórmulas de búsqueda en función de la retroalimentación. información. Consulte la sección de estrategia de búsqueda.

2. Estrategia de búsqueda

(1) El concepto de estrategia de búsqueda

La llamada estrategia de búsqueda consiste en determinar el sistema de búsqueda en función del análisis de las unidades conceptuales del contenido del tema, documentos de búsqueda, métodos de búsqueda y términos de búsqueda, y organizar científicamente la relación posicional, la relación lógica y los pasos de búsqueda entre los términos de búsqueda. El hecho de que la estrategia de recuperación se considere de manera integral afecta directamente la tasa de recuperación y la tasa de precisión del documento.

(2) Pasos para formular una estrategia de recuperación

El requisito previo para formular una estrategia de recuperación es aclarar el rendimiento básico de la base de datos y de todo el sistema de recuperación. Diferentes bases de datos tienen diferentes contenidos de recopilación, métodos de indexación y métodos de recuperación, y diferentes sistemas de recuperación están equipados con diferentes capacidades técnicas y operadores. Antes de formular una estrategia de búsqueda, existen varios métodos de búsqueda para la base de datos y es necesario comprender claramente las reglas que siguen la indexación de estos métodos. Si enumera puntos de acceso que no están disponibles en el sistema en la lista de preguntas, no podrá buscar la literatura.

(3) La base para formular una estrategia de búsqueda es aclarar los requisitos de contenido y el propósito de búsqueda del tema de búsqueda. Sobre esta base, podemos analizar el concepto de temas de recuperación. Si el tema pertenece a un solo concepto, podemos expresarlo con un solo término de búsqueda. Si el concepto del tema es relativamente complejo, podemos descomponer el concepto complejo en varias unidades conceptuales y luego usar operadores lógicos para hacer coincidir las frases de búsqueda que expresan las unidades conceptuales. Al convertir unidades conceptuales en términos de búsqueda, intente elegir términos estandarizados. Tenga especial cuidado al buscar temas nuevos, temas marginales o conceptos oscuros, ya que estos términos a menudo no están incluidos en el sistema. En este caso, las palabras clave con importancia de recuperación en esta disciplina deben seleccionarse de las categorías profesionales, es decir, palabras libres; de lo contrario, se producirán detecciones falsas o detecciones perdidas.

(4) La clave de la estrategia de búsqueda es la correcta selección de palabras y símbolos lógicos.

(5) Ajustar la estrategia de búsqueda. En la recuperación por computadora, a menudo hay situaciones en las que hay muy pocos o incluso ningún documento, o demasiados documentos. Como buscador, debe analizar junto con los usuarios y ajustar las estrategias de búsqueda de manera oportuna para lograr resultados de búsqueda satisfactorios. Si hay demasiados o muy pocos recursos de documentos, podemos aumentar o disminuir el alcance de la búsqueda agregando términos de búsqueda y usando lógica booleana para reducir o aumentar la cantidad de documentos encontrados. En términos generales, la suma lógica siempre reduce el alcance de la búsqueda para lograr el propósito de una búsqueda precisa; la suma lógica siempre expande el alcance de la búsqueda para lograr el propósito de buscar todo. La búsqueda lógica no exclusiva siempre reduce el alcance de la búsqueda y logra el propósito de una búsqueda precisa.

3. Eficiencia de recuperación

La eficiencia de recuperación es el resultado efectivo cuando se utiliza un sistema (o herramienta) de recuperación para llevar a cabo servicios de recuperación. Refleja directamente el desempeño del sistema de recuperación y afecta la competitividad del sistema en el mercado de la información y los intereses de los usuarios. La eficiencia de recuperación incluye dos aspectos: efecto técnico y efecto socioeconómico. El efecto técnico se refiere principalmente al rendimiento y la calidad del servicio del sistema, y ​​al grado en que el sistema satisface las necesidades de información del usuario. El efecto socioeconómico se refiere a cómo el sistema puede satisfacer las necesidades de los usuarios de manera económica y efectiva, de modo que los usuarios o el propio sistema puedan obtener ciertos beneficios socioeconómicos. Lo que discutiremos a continuación es principalmente la evaluación de los efectos técnicos del sistema.

Lo más ideal en la recuperación es que la tasa de recuperación y la precisión sean del 100%, es decir, se recuperan todos los documentos relevantes recopilados en la base de datos y los documentos recuperados son todos documentos relevantes. Pero, de hecho, hay muchos factores que hacen que este indicador sea difícil de alcanzar y siempre habrá algunos errores. Luego hay dos indicadores para evaluar los errores: la tasa de detección fallida y la tasa de detección falsa.

En el trabajo de evaluación, la tasa de recuperación y la tasa de precisión son las más utilizadas y deben usarse al mismo tiempo, de lo contrario, será difícil reflejar la función del sistema de recuperación y la eficiencia de la recuperación. resultados. La combinación de tasa de precisión y tasa de recuperación describe la relación entre la tasa de éxito de recuperación, la tasa de recuperación y la tasa de precisión del sistema, es decir, a medida que aumenta la tasa de recuperación, la tasa de precisión disminuye y viceversa. En la recuperación por computadora, generalmente se cree que la tasa de precisión es del 60% al 70% y la tasa de recuperación es del 40% al 60%.

El alcance del sistema, el lenguaje de indexación, la indexación y la recuperación son factores que afectan la tasa de recuperación y la tasa de precisión, y no se discutirán aquí.

4. Medidas para mejorar la eficiencia de la recuperación

(1) Mejorar la calidad de edición de la biblioteca de documentos, hacer que su colección sea más completa, satisfacer las necesidades de las disciplinas o especialidades correspondientes, y describir el contenido con más detalle y precisión.

(2) Para mejorar la calidad de la indexación, la indexación debe ser consistente, con palabras apropiadas y combinaciones razonables, y esforzarse por: revelar correctamente el tema, reflejarlo completamente sin perder etiquetas; usar símbolos de manera concisa; y no Abusar de las normas.

(3) Mejorar la especificidad del lenguaje de indexación y la calidad del tesauro. Fortalecer el control del vocabulario del índice, mejorar la estructura del tesauro y su relación de citas, de modo que el lenguaje del índice sea propicio tanto para la indexación étnica como para la recuperación de características. Se debe perfeccionar la estructura del vocabulario, la relación entre las palabras debe ser correcta, se deben dominar correctamente los sinónimos y la polisemia y se debe reflejar oportunamente la terminología de las nuevas disciplinas y las nuevas tecnologías.

(4) Mejorar el nivel de trabajo y la capacidad del personal de búsqueda, comprender el contenido incluido en la base de datos y profundizar la comprensión de la estructura del tesauro, realizar análisis de temas correctos, seleccionar documentos de búsqueda apropiados y seleccionar palabras de búsqueda apropiadas. expresar el contenido del tema, hacer combinaciones lógicas apropiadas, encontrar el mejor método de recuperación y formular la mejor estrategia de recuperación.

(5) Ajustar la recuperación y la precisión.

En la recuperación real, la tasa de recuperación y la tasa de precisión se pueden ajustar razonablemente de acuerdo con las diferentes necesidades de recuperación, de modo que los resultados de la recuperación puedan cumplir con los requisitos de recuperación en la mayor medida posible. En las búsquedas reales, a veces la tasa de recuperación es muy alta, y si espera no perderse documentos relevantes, la tasa de recuperación será menor a veces solo necesita buscar algunos artículos nuevos importantes, no todos; Aquí, necesita mayor precisión, una menor recuperación está bien. En resumen, la tasa de recuperación y la tasa de precisión deben ajustarse razonablemente durante el proceso de recuperación para lograr el mejor efecto de recuperación.