¿Por qué algunas personas dicen que los datos no tendrán precio?
¡Hola, soy Tecnología 1 más 1! ¡Me parece muy interesante esta pregunta! Sí, lo más valioso en este momento, déjame decirlo, ¡son los datos! Hay dos respuestas a esta pregunta.
1. ¿Qué son los datos?
Definición: Los datos se refieren a símbolos que pueden registrar e identificar eventos objetivos, símbolos físicos que registran la naturaleza, el estado y la relación de cosas objetivas, o una combinación de estos símbolos físicos. Es un símbolo abstracto reconocible.
No sólo se refiere a números en sentido estricto, sino que también puede ser una combinación de texto, letras, símbolos digitales, gráficos, imágenes, vídeos, audios, etc. También es una representación abstracta de los atributos, cantidad, ubicación y relaciones de las cosas objetivas. Por ejemplo, "0, 1, 2...", "nublado, lluvioso, cayendo, temperatura", "rendimiento de los estudiantes, transporte de carga", etc., son todos datos. Los datos se procesan en información.
En informática, datos se refiere a todos los medios simbólicos que pueden ingresarse en una computadora y procesarse mediante un programa informático. Es un término general para números, letras, símbolos y cantidades analógicas que se utilizan para ingresar en una computadora electrónica para su procesamiento. Actualmente, las computadoras almacenan y procesan una amplia variedad de objetos, y los datos que representan estos objetos son cada vez más complejos.
Información
La información y los datos están relacionados y son diferentes. Los datos son la expresión y portador de información, que pueden ser símbolos, caracteres, números, sonidos, imágenes, videos, etc. La información es la connotación de los datos. La información se carga en los datos para darles una explicación significativa. Los datos y la información son inseparables. La información se basa en los datos para expresar información, y los datos expresan información de manera vívida y concreta. Los datos son simbólicos y físicos, la información es información obtenida después del procesamiento de datos y afecta la toma de decisiones, y es lógica y conceptual, los datos son la expresión de información, y la información es la representación significativa de los datos. Los datos son la expresión y el portador de información, y la información es la connotación de los datos y la relación entre forma y calidad. Los datos en sí mismos no tienen sentido. Los datos se convierten en información sólo cuando afectan el comportamiento de las entidades.
Semántica de datos
La representación de datos no puede expresar completamente su contenido y requiere interpretación. Los datos y la interpretación de los datos son inseparables. Por ejemplo, 93 es un dato, que puede ser la puntuación de un determinado compañero en un determinado curso, el peso de una persona o el número de estudiantes en la promoción de 2013 del departamento de informática. La interpretación de datos se refiere a la explicación del significado de los datos, lo que se denomina semántica de los datos y es inseparable de su semántica.
Clasificación
Dividido por naturaleza
(1) Posicionamiento, como varios datos de coordenadas;
(2) Cualitativo, como datos que representan los atributos de las cosas (áreas residenciales, ríos, carreteras, etc.);
(3) Datos cuantitativos que reflejan las características cuantitativas de las cosas, como longitud, área, volumen y otras cantidades geométricas o peso, velocidad y otras cantidades físicas;
(4) Datos de tiempo que reflejan las características de tiempo de las cosas, como año, mes, día, hora, minuto, segundo, etc.
Divididos según la forma de expresión
① Datos numéricos, como diversos datos estadísticos o de medición. Los datos digitales son valores discretos dentro de un determinado intervalo [3];
(2) Los datos analógicos, compuestos por funciones continuas, se refieren a cantidades físicas que cambian continuamente dentro de un determinado intervalo y también se pueden dividir. en datos gráficos (como puntos, líneas, superficies), datos de símbolos, datos de texto y datos de imágenes, como cambios en el volumen del sonido y la temperatura.
2. La importancia de los datos Hoy en día, big data ya no es un término desconocido. Muchas industrias han logrado muy buenos resultados después de utilizar big data. Big data e Internet se complementan, están interconectados y continúan desarrollándose rápidamente.
Los datos en Internet aumentan a un ritmo del 40% cada año, duplicándose cada dos años. Actualmente, más del 90% de los datos del mundo se generaron en los últimos años. Según la predicción de IDC, el próximo año habrá un total de 35 ZB de datos en el mundo e Internet está a la vanguardia del desarrollo de big data. Con el desarrollo de la era de Internet, la gente parece haberse acostumbrado a digitalizar sus vidas a través de Internet para facilitar compartir, grabar y recordar.
El big data rodea muchos aspectos de nuestras vidas.
Los macrodatos rodean todos los aspectos de nuestras vidas y se reflejan de forma más intuitiva en las herramientas sociales que utilizamos todos los días. Por ejemplo, Tencent tiene datos de relaciones de usuarios y datos sociales basados en estos, que pueden analizar la vida y el comportamiento de las personas, extraer información en política, sociedad, cultura, negocios, salud y otros campos, e incluso predecir el futuro. En pocas palabras, actualizamos nuestras actualizaciones y nuestro círculo de amigos a través de QQ, WeChat y Weibo todos los días, los cuales forman una especie de datos. Big data significa que puedes inferir tus aficiones, tu trabajo, tu dirección, tus ingresos, etc. a través de la gran cantidad de información que actualizas.
¿Qué tan poderoso es el big data en la era de Internet?
¿Qué tan poderoso es el big data en la era de Internet? Big data es como una mina de carbón con energía. El carbón se divide en carbón coquizable, carbón de antracita, carbón graso y carbón pobre según sus propiedades, y los costos de extracción de las minas de carbón a cielo abierto y las minas de carbón de montaña profunda son diferentes. De manera similar, los macrodatos no son "grandes" sino "útiles", y el contenido de valor y los costos de extracción son más importantes que la cantidad. La especialización en ingeniería de aplicaciones de big data estudia principalmente tecnología WEB, JAVA, JSP, grandes bases de datos Oracle, clústeres LINUX, bases de datos no relacionales NoSql, Hadoop y otras tecnologías. A través del estudio de estos cursos, los estudiantes pueden desarrollar JAVAEE, analizar y extraer big data. Durante el proceso de empleo, los estudiantes pueden ingresar a empresas de software tradicionales para desarrollar proyectos de software tradicionales como OA y ERP. También pueden analizar y extraer en profundidad big data y construir grupos de servidores.
En la era del big data, debemos hacer un uso razonable del big data para crear una mayor eficiencia en el trabajo y crear más riqueza.
¡Entonces los datos son dinero! ¡Dominar big data es dominar la riqueza!
¡Gracias por leer!
Los datos en sí no tienen valor o son muy pequeños, y el valor se da. Al igual que el oro, el valor del oro son sus perspectivas o escenarios de aplicación.
El valor de los datos es el ingreso reflejado en las capacidades de los datos, o el retorno de la inversión.
Hoy discutiremos las capacidades y el valor de los datos. Cuando hablamos de big data, debemos mencionar el almacén de datos. En sus etapas finales, el almacén de datos empresarial puede convertirse en el sistema nervioso central del cerebro. Si se quiere dar soporte a todo el complejo cerebro y sistema nervioso, se necesita una serie de mecanismos complejos para cooperar.
1. Arquitectura abstracta de capacidades de datos. Resumo de manera abstracta las capacidades de datos en cuatro direcciones: capacidad de transmisión, capacidad de computación, capacidad de algoritmo y nivel de activos de datos. Más adelante hablaré sobre la aplicación y el valor de los datos resumidos en estas cuatro capacidades.
1. Capacidad de transmisión de datos
La mayoría de los escenarios de uso de datos inevitablemente implicarán la transmisión de datos. El rendimiento de la transmisión de datos determina la implementación de algunos escenarios de aplicación, llamadas y procesamiento de datos en tiempo real. , Recomendación de algoritmos, predicción, etc. El sistema de soporte abstracto para la transmisión es la arquitectura de almacenamiento de datos subyacente (por supuesto, el entorno de red también debe considerarse para la transmisión en diferentes salas de computadoras). Las llamadas simples con pequeñas cantidades de datos generalmente no involucran esto, pero cuando la cantidad de datos es grande, la concurrencia es alta y los requisitos de SLA son estrictos, es una prueba de las capacidades de transmisión de datos).
Desde la perspectiva del producto, divido las capacidades de transmisión de datos en: eficiencia de transmisión de datos subyacente y eficiencia de transmisión de datos de la capa de aplicación.
La eficiencia de transmisión de datos subyacente se refiere a la eficiencia de transmisión en la etapa de preprocesamiento después de que ingresa la fuente de datos, es decir, antes de que se procese en los entregables de datos requeridos por el producto.
Ps: los datos requieren un largo proceso de procesamiento antes de que puedan ser utilizados por los productos. Los productos de datos de la capa de aplicación básicamente no cubren los enlaces de procesamiento de datos subyacentes, pero los productos de datos utilizarán entregables de datos específicos (es decir, datos estructurados o estandarizados acordados) y utilizarán estos entregables de datos para analizar escenarios de aplicación reales a través del producto. servicios de datos. Incluso los productos relacionados que se ocupan de la gestión de datos subyacentes son llamadas a metadatos, registros de uso o shells escritos.
La eficiencia de transmisión involucrada en el procesamiento y cálculo de datos subyacentes determina directamente los requisitos propios para respaldar el alto rendimiento y la alta confiabilidad de los productos de datos; la transmisión de la capa de aplicación afecta la experiencia del usuario y la realización de escenarios. Los mecanismos y sistemas de transmisión son tan complejos como los capilares de todo el cuerpo, pero la velocidad de circulación determina directamente si el cerebro recibe suficiente oxígeno.
2. Poder de computación de datos
El poder de computación de datos es como el sistema hematopoyético, que produce sangre a partir de materiales nutricionales de diversas fuentes. A través de la arquitectura de tecnología distribuida de alto rendimiento del almacenamiento múltiple subyacente, los datos de origen se limpian mediante ETL (extraído, transformado y cargado) y el producto son datos estructurados universales que se pueden entregar en la capa intermedia de datos. La velocidad de cálculo, al igual que la velocidad de hematopoyesis, determina el suministro. La velocidad informática determina directamente la puntualidad y los escenarios de aplicación de las aplicaciones de datos.
En la actualidad, el más común es el inventario de almacén fuera de línea, que principalmente desempeña el papel de retrospectiva, es decir, no hay forma de garantizar la puntualidad de los datos, lo que retrasa la salida de las aplicaciones de análisis de datos, lo que resulta en demasiada experiencia y dificultad para tomar decisiones en tiempo real. El inventario de almacén en tiempo real e incluso el procesamiento de lagos de datos en tiempo real han abierto gradualmente una variedad de escenarios. Independientemente de si los enormes costos generados por los requisitos cada vez más estrictos en tiempo real pueden generar beneficios equivalentes.
Un tiempo real fuerte puede acercarse a un estado "futuro", que es este momento. Esto es mucho más valioso que las predicciones algorítmicas del futuro, porque para una empresa es más valioso captar el presente que construir un futuro cambiante. Incluso en el caso en que el procesamiento de datos sea más rápido que la transmisión de neuronas, el resultado impulsor del procesamiento de datos, desde el momento en que se obtienen las ondas cerebrales, es mucho más rápido que la transmisión de neuronas al miembro impulsor.
¿Es similar a la situación en la que los soldados y los caballos avanzan antes de que se utilice la comida y el pasto? Por supuesto, esto es desde la perspectiva de la potencia informática de datos. Desde mi perspectiva personal, una vez que la capacidad general de datos alcanza una determinada etapa, cambiará subjetivamente su voluntad personal, es decir, guiará su cerebro para controlar o decidir su comportamiento personal sin hacerle sentir, por lo que puede entenderse como un cambio subjetivo. tu voluntad personal.
Desde una perspectiva humana, no sabes o no quieres decidir intuitivamente qué hacer a continuación, porque el cerebro es un procesador lógico. Por supuesto, esto involucra psicología, por lo que no entraré en detalles aquí. en otro espacio a continuación. Perspectivas y supuestos futuros para las aplicaciones de datos.
3. Capacidades de los activos de datos
Todo el mundo habla de "grandes" datos, por lo que cuanto mayor sea la cantidad de datos, ¿mejor? No, desde cierta perspectiva, una gran cantidad de datos que no tienen valor o no han sido explorados es una carga y la enorme pérdida de recursos no se puede eliminar fácilmente.
Con la rápida amplificación de la magnitud de los datos, se han creado islas de datos: los datos son incognoscibles, no están conectados, son incontrolables e indeseables; por lo tanto, los datos dispersos sólo pueden utilizarse mejor si se convierten en activos.
¿Qué son los activos de datos? Creo que se puede definir en términos generales como datos de entrega directamente disponibles, que pueden clasificarse como un activo. Por supuesto, hay muchas formas de datos que se pueden utilizar directamente, como metadatos, atributos, indicadores, etiquetas y datos estructurados o no estructurados ETL.
Actualmente, los escenarios de uso de los lagos de datos también se están expandiendo constantemente. La tendencia hacia consumir y procesar datos del lago de datos directamente y en tiempo real es una forma de ampliar el alcance y la utilización de los activos de datos empresariales. Esto ayudará a superar las limitaciones del marco de datos del modelo de almacén de datos y habrá mayor espacio para la imaginación a la hora de cambiar la forma en que se utilizan los datos.
El valor de los activos de datos se puede considerar en dos partes: una es el valor obtenido directamente por los activos de datos; la otra es el valor comercial de proporcionar servicios de datos después de procesar los activos de datos como recursos.
La primera parte es fácil de entender, que consiste en evaluar el valor de la variable de salida del conjunto de datos en función de la cantidad de datos, como etiquetas, muestras y conjuntos de entrenamiento; , como la mejora de la aplicación mediante la aplicación de algoritmos de optimización entrenados en sus propios datos. El valor de los ingresos comerciales, o el marketing basado en la publicidad de datos, o incluso el valor de las capacidades de gestión de activos de datos acumulados que sirven al mundo exterior como activos intangibles de conocimiento. . Estas formas indirectas de realizar aplicaciones y servicios de datos también son manifestaciones del valor de los activos de datos y pueden cuantificarse con precisión.
4. Capacidades de algoritmo de datos
De hecho, las capacidades de transmisión y las capacidades informáticas están relativamente sesgadas hacia la realización de datos subyacentes, y los servicios de algoritmo proporcionados por las capacidades de algoritmo son los más cercanos a los escenarios comerciales. Esta es la capacidad de datos que se aplica más directamente a escenarios comerciales y es más fácil de percibir para los usuarios, porque para la transmisión y el cálculo, lo que los usuarios perciben es velocidad. Desde la perspectiva del usuario, lo rápido es apropiado, por lo que los usuarios no saben cuándo y. donde Calcular o transmitir.
El escenario de aplicación del algoritmo es un proceso de 0 a 1, de nada a algo. El algoritmo se basa en capacidades de transmisión de datos, computación y activos, o en otras palabras, la evolución encapsulada de tres capacidades básicas.
La capacidad del algoritmo es transformar múltiples conjuntos de datos o la mayor cantidad de datos posible en resultados de toma de decisiones y aplicarlos a escenarios comerciales. La fortaleza de las capacidades del algoritmo refleja si las tres capacidades de datos cooperan de manera eficiente y si existe un efecto barril. Lo peor es que no hay ningún efecto barril. Por supuesto, los algoritmos simples también pueden proporcionar servicios como acumulación de conocimiento de activos intangibles.
Para las cuatro capacidades de la arquitectura de capacidad de datos, la transmisión, la informática y los activos son capacidades básicas, y los algoritmos son capacidades resumidas de alto nivel. Solo la producción y la aplicación de capacidades pueden reflejar el valor de los datos. La producción máxima de capacidades de datos pone a prueba la versatilidad y flexibilidad de todo el sistema de arquitectura de productos de datos. Debido a que debemos enfrentar múltiples escenarios desarrollados a partir de diversos negocios, la demanda de capacidades de datos es desigual: puede ser unilateral o puede ser la colaboración de múltiples capacidades. Este es un gran desafío para la versatilidad del producto. Para manejar mejor este problema, es posible que necesitemos la matriz de productos de toda la plataforma de datos para respaldarla y potenciarla.
2. Presentación del valor de los datos correspondiente a las capacidades de los datos. Desde la perspectiva de la aplicación de datos, cada capacidad se puede abrir o combinar de forma independiente. Si es una manifestación de capacidades, proviene del problema de la forma del producto y es el entregable que entra en juego después de que se adaptan las capacidades. Hablando de forma de producto, puedes imaginar escenarios de aplicación.
En primer lugar, el escenario de aplicación más básico es la llamada directa de datos. El uso de activos de datos se basará básicamente en formas de entrega como características, indicadores, etiquetas o conocimientos. Para los usuarios, estos datos se utilizarán como materia prima semiacabada o base para procesamiento secundario y aplicaciones en escenarios comerciales, como análisis de datos, extracción de datos, capacitación y verificación de algoritmos, gráficos de conocimiento, recomendaciones personalizadas, entrega precisa (alcance), Control de riesgos, etc. Los activos de datos pueden autorizarse colectivamente en el mercado de datos a través de algunas OpenAPI.
Para una fábrica, además de las barreras de sus propias materias primas (activos de datos), la competitividad central es muy pequeña. Necesita empaquetar algunos servicios básicos de nivel superior para mejorar la competitividad, por lo que la capacidad. para integrar los cálculos de datos se utiliza para llevar a cabo el procesamiento de materias primas. Procesamiento secundario (estadísticas resumidas).
Las capacidades estadísticas agregadas de los cálculos pueden cumplir con el soporte de la mayoría de los escenarios de análisis de datos, no solo la producción de materias primas sin contenido técnico, sino también la evitación de la sensibilidad de los datos en forma de productos semiacabados. Porque para las estadísticas, este es un resultado o conclusión de un análisis y no implica la salida de sus propios datos confidenciales, por lo que sus activos principales no se filtrarán y solo se generará el valor agregado de los activos. En otras palabras, la patente de propiedad intelectual todavía está en sus manos y puede obtener un retorno de la inversión controlando la capacidad de generalización de la patente.
Algunos escenarios de análisis después de integrar capacidades informáticas, como: análisis de retrato de multitudes, análisis cruzado multidimensional, análisis de estrategia empresarial, análisis de seguimiento, etc.
Con el desarrollo de los tiempos y el aumento de los escenarios comerciales, las fábricas continúan necesitando una transformación industrial, profundizar la industria de servicios, abandonar gradualmente la forma de fabricación y actualizar integralmente los servicios de datos más avanzados. En este momento, se agrega la capacidad del algoritmo para mejorar mejor la matriz de servicios.
Este algoritmo encapsula las capacidades de transmisión, computación y activos, y proporciona una mejor y unificada comprensión de la predicción e identificación de objetivos de escenarios comerciales. De esta manera, es más fácil para las empresas aceptar y utilizar servicios de datos a bajo costo sin involucrar procesamiento de datos. Solo necesitan un resultado objetivo y utilizan la toma de decisiones algorítmica como referencia para guiar la dirección del negocio. Por ejemplo, la predicción y el análisis de algunos escenarios comerciales mediante algoritmos, e incluso el reconocimiento o el aprendizaje y el pensamiento de algunos escenarios de inteligencia artificial se pueden lograr mediante el empoderamiento de los algoritmos. Para las empresas, es un gran avance desde cero y el proceso de desarrollo de la empresa puede incluso impulsarse durante varios años.
Los escenarios de aplicación de las capacidades anteriores son todas pruebas de capacidades de transmisión de datos.
La importancia de los "datos" puede ser la siguiente.
1. Los datos pueden proporcionar apoyo a las decisiones de los ejecutivos de negocios. Después del análisis estadístico y la extracción de datos masivos de la empresa, la alta dirección puede formular medidas razonables.
2. Los datos pueden integrar el complejo negocio de la empresa. Cada empresa tiene un sistema empresarial muy complejo y su complejo negocio se puede integrar con la ayuda de datos y las plataformas correspondientes.
3. Los datos pueden reflejar la naturaleza y la tendencia de los acontecimientos. Los datos reales pueden comprender mejor la naturaleza de los eventos y predecir su desarrollo.
4. Los datos pueden ayudar a las personas a entenderse mejor a sí mismas. ¿Quizás realmente no te conozcas muy bien en el futuro? Pero puedes utilizar datos personales para crear un retrato y obtener una comprensión integral del individuo.
5. Los datos pueden reflejar la historia y mirar hacia el futuro. Consulta el pasado a través de datos históricos y también puedes utilizar datos del pasado para detectar el futuro.
En definitiva, en el contexto de la tendencia del big data y la tecnología 5G, los "datos" son cada vez más comunes, como redes sociales, información de consumo, registros de viajes... datos de ventas a nivel empresarial. , Datos de operaciones, datos de producto y datos de actividad...