En cuanto a la utilidad de la Minería de textos


Cuando hacemos una consulta en Internet, como respuesta de los buscadores, recibimos una gran catidad de información y quizás deseamos solamente quedarnos con los aspectos que nos son relevantes de dicha información.


Por esta razón, se ha buscado desarrollar herramientas computacionales que permitan identificar los aspectos que nos son importantes de los textos y con ellos obtener la información deseada.


Con estos objetivos los lingüistas han adoptado perspectivas de análisis basadas en sus conocimientos de la estructura del idioma, por ejemplo usando análisis léxico de los textos y, con ello, determinar los aspectos relevantes del mismo.


Otra perspectiva es la extracción de palabras o frases claves, que en su parte más simple son proporcionadas por los interesados para luego ser comparadas con los textos.


Estas dos formas de abordar el problema generan códigos computacionales complejos, o que requieren la intervención de expertos en cada campo para extraer la información.


Uno de los conceptos fundamentales de la física estadística es la entropía, concepto que está relacionado con las diferentes formas de poder encontrar un sistema si uno atiende a las variables microscópicas (conocimiento del movimiento de cada molécula), pero que desde el punto de vista macroscópico son indistinguibles (conocimiento de la presión y temperatura en el ejemplo anterior). Esta forma de visualizar los textos nos ha permitido encontrar las palabras o frases relevantes de textos y también encontrar textos similares, y por lo tanto, seleccionar la información que deseamos de entre el millar de posibilidades.