El papel real de IPC_¿Qué significa la tecnología IPC?
1. Continuación de las funciones tradicionales
La Guía del usuario de la IPC señala que la IPC es una herramienta para la clasificación uniforme de documentos de patente de varios países. Con la ayuda de este sistema de clasificación de documentos de patente unificado internacionalmente, se pueden establecer herramientas eficaces de búsqueda de documentos de patente para que las oficinas de patentes y otros usuarios evalúen la novedad y el nivel inventivo de las solicitudes de patente.
En términos de servicios de información, la IPC también tiene las siguientes funciones:
(a) El uso de tablas de clasificación para organizar documentos de patente permite a los usuarios obtener fácilmente información técnica y jurídica;
(b) Como base para la presentación de informes selectivos por parte de los usuarios de información sobre patentes;
(c) Como base para investigar el nivel técnico existente en un determinado campo técnico;
(d) Como base para las estadísticas de propiedad industrial a fin de evaluar los avances tecnológicos en diversos campos.
Además, la IPC es también una herramienta para el examen, la gestión y las estadísticas de las oficinas de patentes.
2. Como herramienta para realizar una clasificación inteligente por ordenador.
No hace falta decir que la IPC es producto de las condiciones históricas de los documentos de patente en papel y la tecnología de la información subdesarrollados. Algunos de los principios y principios en su desarrollo parecen un poco obsoletos desde la perspectiva actual. Pero depende de la esencia. La esencia de la IPC es un sistema de indexación de navegación de clasificación, y la aplicación de este sistema es la indexación de documentos de patente. Hoy en día, con el rápido desarrollo de la tecnología de la información, un sistema de indicadores que ha sido probado en la práctica todavía tiene su importancia práctica indispensable para la aplicación de la tecnología de la información.
Para una clasificación inteligente, la solución básica es convertir el IPC en una "versión electrónica" legible por máquina. Esta versión electrónica legible por máquina es en realidad una tabla de expresiones de lenguaje electrónico con IPC como marco de estructura de árbol. No solo transforma los términos técnicos actuales de IPC y los métodos de descripción de frases o lenguaje natural en términos técnicos y términos de relación, así como palabras y términos. combinación y relación lógica entre palabras. A través de la programación informática, los términos profesionales (incluidos sinónimos) y los términos relacionales (incluidos verbos, preposiciones, etc.) se cuentan según la frecuencia, posición y relación de las palabras en las ocho partes de las instrucciones de la aplicación de codificación, y se analiza la relación entre las palabras. y juzgado. Expresión de relaciones lógicas. A través de estadísticas ponderadas y procesamiento de basura, finalmente se enumeran las posiciones de clasificación según el grado de asociación con la versión electrónica del IPC. Las categorías enumeradas pueden ser unas pocas o una docena. Porque, en este momento, ya no las consideramos simplemente clasificaciones y subclasificaciones principales en el sentido tradicional, sino índices de casos de solicitud, creando así las condiciones para el siguiente paso de recuperación inteligente de documentos de patente.
Como se mencionó anteriormente, esta reforma será una reforma estructural del IPC, que es muy difícil y requiere una cantidad considerable de trabajo, pero una vez completada, será de gran importancia. Para entonces, ya no serán necesarios examinadores de clasificación dedicados a completar la clasificación manual de las solicitudes durante el proceso de revisión de patentes. Lo que hay que hacer se centrará principalmente en recopilar comentarios fuera del proceso, estudiar la mejora del formulario electrónico, enriquecer la connotación del formulario electrónico, etc. Este formulario de expresión del lenguaje electrónico será mantenido por múltiples expertos en clasificación. El manejo de disputas confidenciales todavía se deja en manos del departamento de examen, y sólo los resultados del manejo de disputas deben resumirse en manos de expertos. Es posible que a este trabajo le quede un largo camino por recorrer, pero el autor cree que es muy probable que la clasificación inteligente de solicitudes de patente se convierta en un pionero en la realización de una revisión inteligente de patentes.
3. Puede utilizarse como una herramienta importante para realizar la recuperación inteligente por computadora.
Como otra área a desarrollar por IPC, es utilizar IPC para realizar recuperación inteligente por computadora, incluida la determinación inteligente o expansión de campos de búsqueda, análisis inteligente, selección de registros de búsqueda, etc.
La recuperación inteligente por computadora es uno de los objetivos actuales que persigue la industria de la tecnología de la información y también es la dirección de nuestra oficina para mejorar el sistema de recuperación de patentes de mi país. Realizar una recuperación inteligente de documentos de patentes chinos puede resolver fundamentalmente los problemas de tasa de recuperación y tasa de precisión, mejorando así la eficiencia y la calidad del examen. Resolver el problema de la recuperación inteligente no parece ser un gran problema a partir del análisis de las condiciones del software y el hardware. En la actualidad, algunos sistemas de recuperación comerciales han implementado inicialmente la recuperación inteligente basada en tesauros, pero debido a deficiencias inherentes, a menudo son vagos e inadecuados para la recuperación de documentos de patente. El autor cree que la razón por la que la recuperación inteligente de documentos de patente permanece en el papel es principalmente para determinar la solución técnica para realizar la recuperación inteligente y la gran cantidad de trabajo básico requerido para implementar la solución técnica.
Desde la perspectiva de las soluciones técnicas, la recuperación pura de palabras de texto completo y la indexación manual pura o la indexación automática de segmentación de palabras no pueden resolver completamente el problema de la recuperación de documentos de patente. Dado que el chino utiliza palabras formadas por combinaciones de palabras como unidad de descripción del texto, se genera más incertidumbre. Es posible que la búsqueda de términos comunes no sea un tema destacado. Sin embargo, no basta con buscar en toda la bibliografía sobre patentes. El uso de IPC para la recuperación puede compensar las deficiencias anteriores. Porque el IPC clasifica temas técnicos con los mismos atributos en el mismo número de categoría según métodos de clasificación científica. Bajo un mismo número de clasificación no sólo se puede encontrar la misma materia que la invención, sino que también se pueden encontrar soluciones técnicas similares. Además, aunque muchas bases de datos hacen un buen trabajo procesando datos de origen, como la indexación profunda, su indexación tiene ciertos principios. Las palabras que son demasiado comunes, generalmente no están indexadas. Si la clasificación de patentes se utiliza como representación de índice, no sólo puede incluir estas palabras, sino que también puede abarcar las características técnicas, los temas técnicos e incluso las soluciones técnicas de los documentos de patente en términos de connotación técnica.
Por lo tanto, es necesario adoptar un modelo de recuperación que combine la indexación de palabras, palabras y categorías para resolver el problema de la recuperación inteligente china (se puede conservar la indexación manual, pero debe usarse como medio auxiliar para realizar una indexación en profundidad en algunos campos especiales y mejorar los datos de origen).
Para ello, podemos desempeñar el papel de IPC en dos aspectos. En primer lugar, además de la tecnología de recuperación de texto completo, se debe establecer un conjunto de léxico, incluido un léxico, para la recuperación de palabras. IPC y el índice de palabras clave que admite pueden ser la herramienta marco básica para generar el tesauro. Hasta cierto punto, la oficina de patentes está calificada para convertirse en la base de producción básica de tesauros en el campo de la ciencia y la tecnología de China. Este tesauro puede tener las siguientes características: En comparación con los tesauros utilizados por todas las industrias, puede que no sea el mejor ni el más popular, pero no es mejor ni más popular que todas las industrias. En segundo lugar, la versión en lenguaje electrónico de la CIP mencionada anteriormente y la indización de clasificaciones son medios importantes para enriquecer la recuperación y se utilizarán como método práctico para la recuperación inteligente de documentos de patente. El uso de la división de dominios, el sistema de clasificación y las relaciones de ubicación de IPC puede ayudarnos a realizar una recuperación inteligente. Por ejemplo, si solo ingresamos una categoría principal o un nombre de campo técnico o incluso una palabra clave en la fórmula de búsqueda, el sistema de búsqueda inteligente puede completar automáticamente la búsqueda dentro del rango relevante y obtener los requisitos de búsqueda que desea pero que no ha expresado completamente. Utiliza inteligencia artificial informática para simular análisis, juicio e integración para extraer los registros de búsqueda que desea de una base de datos masiva.