Para procesamiento de lenguaje natural (NLP) existen muchísimas librerías y como es de esperar una gran cantidad en Pyhton y Java.
Además de NLTK (www.nltk.org), que es la librería lider en NLP hay otras librerías para el procesamiento de texto en Python:
- TextBlob: http://textblob.readthedocs.org/en/dev/
- Gensim: http://radimrehurek.com/gensim/
- Pattern: http://www.clips.ua.ac.be/pattern
- Spacy:: http://spacy.io
- Orange: http://orange.biolab.si/features/
- Pineapple: https://github.com/proycon/pynlpl
Para Java, hay otras muchas:
Si podemos elegir el lenguaje, usaremos el que nos sintamos más cómodos. En el tema de performance java en un poco más rápido pero los científicos eligen Python por su simpleza y su capacidad de hacer mucho escribiendo poco.- Freeling: http://nlp.lsi.upc.edu/freeling/
- OpenNLP: http://opennlp.apache.org/
- LingPipe: http://alias-i.com/lingpipe/
- Stanford CoreNLP: http://stanfordnlp.github.io/CoreNLP/
- CogComp NLP: https://github.com/CogComp/cogcomp-nlp
Tal vez además de las herramientas de procesamiento de lenguaje, necesitaría herramientas de aprendizaje automático para incorporar. Existe un amplio rango en Python y Java, y una vez más depende de las preferencias y si las bibliotecas son lo suficientemente amigables para el usuario:
Bibliotecas de Machine Learning en python:
- Sklearn (Scikit-learn): http://scikit-learn.org/stable/
- Milk: http://luispedro.org/software/milk
- Scipy: http://www.scipy.org/
- Theano: http://deeplearning.net/software/theano/
- PyML: http://pyml.sourceforge.net/
- pyBrain: http://pybrain.org/
- Graphlab Create (Commerical tool but free academic license for 1 year): https://dato.com/products/create/
- Weka: http://www.cs.waikato.ac.nz/ml/weka/index.html
- Mallet: http://mallet.cs.umass.edu/
- Mahout: https://mahout.apache.org/
Además tenemos Spark MLlib que funciona con Python, Java y Scala.
Si están interesados en otros lenguajes o simplemente leer :
- Machine Learning and Natural Language Processing
- What are good starting points for someone interested in natural language processing?
- Natural language processing
- Natural Language Processing in Java (NLP)
- Is there a good natural language processing library
- Simple Natural Language Processing Startup for Java
- What libraries offer basic or advanced NLP methods?
- Latest good languages and books for Natural Language Processing, the basics
- (For NER) Entity Extraction/Recognition with free tools while feeding Lucene Index
- (With PHP) NLP programming tools using PHP?
- (With Ruby) https://stackoverflow.com/questions/3776361/ruby-nlp-libraries