lunes, 24 de junio de 2013

La minería de datos y su importancia en el futuro


Podemos entender como Big Data la referencia a aquellos sistemas que permiten  la creación, manipulación, administración y análisis de grandes volúmenes de datos.

“Entre el nacimiento del mundo y el año 2003, hubo cinco exabytes de información creada. Ahora creamos cinco exabytes cada dos días”

Nada mejor para poner de manifiesto la ingente cantidad de datos existente que esta impactante declaración de Eric Schmidt, director General de Google. En la misma línea, según IBM, en 2012 el 90% de los datos que existían habían sido creados en los dos años anteriores. Habida cuenta de la magnitud del volumen de los datos que circulan diariamente, uno de los principales problemas radica en su adecuado almacenamiento, que permita, a posteriori, una óptima gestión. Se ha puesto en evidencia la necesidad de nuevos modelos de análisis e interpretación de datos, entre los que podemos encontrar (dentro del análisis predictivo) el datamining.

El datamining o minería de datos, es el conjunto de técnicas y tecnologías destinadas a explorar estas grandes bases de datos, localizando mediante el análisis matemático patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un contexto determinado, facilitando su comprensión. Este proceso, destinado a la detección de información procesable, se caracteriza por el empleo de estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

En este sentido, en aras de mejorar las actuales herramientas de que disponen los Big Data, numerosos centros de investigación llevan años progresando en la optimización de los motores de búsqueda. Sus esfuerzos están dirigidos a la creación de medios que permitan a los buscadores de Internet interpretar la búsqueda introducida por el usuario a un nivel semántico, de modo tal que los resultados que se deriven de ella puedan inferirse en base al significado “real” (entendiéndolo asimismo como el pretendido por el usuario), en lugar del resultado de la comparación de las palabras que la componen. El alcance de este avance no está limitado a los motores de búsqueda, extendiéndose a los contenidos de los sitios de Internet, pudiendo vaticinarse que quedarán mejor posicionados aquellos que posean una buena descripción semántica. De este modo, la mejora de la minería web será una prioridad para los administradores de dichos sitios.

Así, son las empresas las que van a realizar un esfuerzo en la obtención de esta información, ya que se trata de un factor estratégico que genera una potencial ventaja competitiva al proporcionarlas información privilegiada a través de la que pueden resolver problemas de negocio, convirtiéndose, de este modo, en un factor clave para ellas.


Enlaces



http://es.scribd.com/doc/90626012/Analisis-Inteligente-de-Datos

No hay comentarios: