Red de conocimiento de abogados - Derecho de sociedades - Cómo utilizar la biblioteca de aprendizaje automático de Python

Cómo utilizar la biblioteca de aprendizaje automático de Python

1. Scikit-learn (muy recomendado)

www .github .com/scikit-learn/scikit-learn

Scikit-learn está basado en Scipy. Un módulo de Python creado para el aprendizaje automático que presenta una variedad de algoritmos de clasificación, regresión y agrupación que incluyen máquinas de vectores de soporte, regresión logística, clasificadores Bayes ingenuos, bosques aleatorios, aumento de gradiente, algoritmos de agrupación y DBSCAN. Y también diseñé las bibliotecas científicas y numéricas de Python Numpy y Scipy2, Keras (aprendizaje profundo)

/fchollet/keras

Keras es un marco de aprendizaje profundo basado en Theano Su diseño hace referencia a Torch. , escrita en lenguaje Python, es una biblioteca de redes neuronales altamente modular que admite GPU y CPU.

3. Lasaña (Deep Learning)

No solo es un delicioso plato italiano, sino también una biblioteca de aprendizaje profundo con funciones similares a Keras, pero su diseño es algo diferente a ellas. .

4.Pylearn2

www .github .com/lisa-lab/pylearn2

Pylearn es un programa de biblioteca basado en Theano que simplifica la investigación del aprendizaje automático. Encapsula muchos modelos y algoritmos de entrenamiento de uso común en la investigación de aprendizaje profundo e inteligencia artificial en un solo paquete experimental, como el descenso de gradiente estocástico.

5.NuPIC

www .github .com/numenta/nupic

NuPIC es una plataforma de inteligencia artificial que utiliza el algoritmo de aprendizaje HTM como herramienta. HTM es un método de cálculo preciso para la corteza. El núcleo de HTM es un algoritmo de aprendizaje continuo basado en el tiempo y un patrón espaciotemporal de almacenamiento y recuperación. NuPIC es adecuado para una amplia variedad de problemas, especialmente la detección y predicción de anomalías a partir de fuentes de datos en streaming.

6. Nilearn

www .github .com/nilearn/nilearn

Nilearn es un módulo de Python que puede aprender rápidamente datos de neuroimagen estadísticamente. Utiliza la caja de herramientas scikit-learn en el lenguaje Python y algunas aplicaciones de modelado predictivo, clasificación, decodificación y análisis de conectividad para realizar estadísticas multivariadas.

7.PyBrain

www .github .com/pybrain/pybrain

Pybrain es la abreviatura de biblioteca de aprendizaje por refuerzo, inteligencia artificial y redes neuronales basada en Lenguaje Python. Su objetivo es proporcionar algoritmos de aprendizaje automático flexibles, fáciles de usar y potentes y probar sus algoritmos en una variedad de entornos predefinidos.

8.Pattern

www .github .com/clips/pattern

Pattern es un módulo de minería de red en el lenguaje Python. Proporciona herramientas para minería de datos, procesamiento de lenguaje natural, análisis de redes y aprendizaje automático. Admite modelos de espacio vectorial, agrupación, máquinas de vectores de soporte y perceptrones y utiliza el método de clasificación KNN para la clasificación.

9.Fuel

www .github .com/mila-udem/fuel

Fuel proporciona datos para su modelo de aprendizaje automático. Tiene una interfaz para compartir conjuntos de datos como MNIST, CIFAR-10 (conjunto de datos de imágenes) y One Billion Words (texto) de Google. Lo utiliza para reemplazar sus propios datos de diversas formas.

10.Bob

www .github .com/idiap/bob

Bob es una herramienta gratuita de procesamiento de señales y aprendizaje automático.

Su caja de herramientas está escrita tanto en Python como en C++. Está diseñada para ser más eficiente y reducir el tiempo de desarrollo. Está compuesta por una gran cantidad de herramientas para procesamiento de imágenes, procesamiento de audio y video, aprendizaje automático y reconocimiento de patrones. paquetes.

11.Skdata

www .github .com/jaberg/skdata

Skdata es un programa de biblioteca para aprendizaje automático y conjuntos de datos estadísticos. Este módulo proporciona el uso estándar de Python para problemas de juguetes, visión por computadora popular y conjuntos de datos de lenguaje natural.

12.MILK

www .github .com/luispedro/milk

MILK es un conjunto de herramientas de aprendizaje automático en el lenguaje Python. Utiliza principalmente métodos de clasificación supervisados ​​entre las muchas clasificaciones disponibles, como SVMS, K-NN, bosques aleatorios y árboles de decisión. También realiza la selección de funciones. Estos clasificadores se combinan de muchas maneras para formar diferentes sistemas de clasificación, como el aprendizaje no supervisado, la propagación de oro por afinidad y la agrupación de K-medias respaldada por MILK.

13. IEPY

www .github .com/machinalis/iepy

IEPY es una herramienta de extracción de información de código abierto que se centra en la extracción de relaciones. Está dirigido principalmente a usuarios que necesitan extraer información de grandes conjuntos de datos y a científicos que quieran probar nuevos algoritmos.

14.Quepy

www .github .com/machinalis/quepy

Quepy es un método de consulta en un lenguaje de consulta de base de datos cambiando las preguntas del lenguaje natural Python estructura. Se puede definir simplemente como diferentes tipos de problemas en el lenguaje natural y consultas de bases de datos. Por lo tanto, puede crear su propio sistema que introduzca lenguaje natural en su base de datos sin codificación.

Quepy ahora brinda soporte para los lenguajes de consulta Sparql y MQL. Y hay planes para extenderlo a otros lenguajes de consulta de bases de datos.

15.Hebel

www .github .com/hannes-brt/hebel

Hebel es una biblioteca para el aprendizaje profundo de redes neuronales en el lenguaje Python. El programa utiliza PyCUDA para la aceleración de GPU y CUDA. Es el tipo de herramienta más importante para los modelos de redes neuronales y puede proporcionar funciones de activación para diversas funciones de actividad, como dinámica, dinámica de Nesterov, pérdida de señal y métodos de parada.

16.mlxtend

www .github .com/rasbt/mlxtend

Es una colección de herramientas y extensiones útiles para el programa de biblioteca de tareas cotidianas de ciencia de datos.

17.nolearn

www .github .com/dnouri/nolearn

Este paquete contiene muchas herramientas útiles que pueden ayudarlo a completar tareas de aprendizaje automático. Módulo de programa. Una gran cantidad de estos módulos funcionan con scikit-learn y otros suelen ser más útiles.

18.Ramp

www .github .com/kvh/ramp

Ramp es una solución desarrollada en lenguaje Python para acelerar la creación de prototipos en programas de biblioteca de aprendizaje automático. . Es un marco conectable liviano basado en pandas para el aprendizaje automático. Proporciona una función de exploración de sintaxis declarativa simple para herramientas estadísticas y de aprendizaje automático existentes en el lenguaje Python (como scikit-learn, rpy2, etc.). y eficientemente.

19.Feature Forge

www .github .com/machinalis/featureforge

Esta serie de herramientas utiliza API compatibles con scikit-learn para crear y probar máquinas. capacidades de aprendizaje.

Esta biblioteca proporciona un conjunto de herramientas que serán útiles en muchos programas de aprendizaje automático. Cuando utilice esta herramienta scikit-learn, sentirá que ha recibido una gran ayuda. (Aunque esto sólo funciona si tienes algoritmos diferentes). 20. REP

www .github .com/yandex/rep

REP está diseñado de forma armoniosa y confiable. El enfoque es un entorno proporcionado por el controlador de movimiento de datos de comando.

Tiene un contenedor clasificador unificado para proporcionar una variedad de operaciones, como TMVA, Sklearn, XGBoost, uBoost, etc. Y puede entrenar clasificadores de forma paralela en una población. También proporciona una trama interactiva.

21.Muestras de máquinas de aprendizaje Python

www .github .com/awslabs/machine-learning-samples Una colección de software sencillo creado con el aprendizaje automático de Amazon.

22.Python-ELM

www .github .com/dclambert/Python-ELM

Esta es una versión extrema basada en scikit-learn en Python Lenguaje Implementación de máquinas de aprendizaje.

23.gensim

Implementación del modelo temático en Python

Semántica estadística escalable

Analizar documentos de texto plano para determinar su estructura semánticaRecuperar documentos semánticamente similares