Podemos entender como Big Data la referencia a aquellos sistemas que permiten la creación, manipulación, administración y
análisis de grandes volúmenes de datos.
“Entre el
nacimiento del mundo y el año 2003, hubo cinco exabytes de información creada.
Ahora creamos cinco exabytes cada dos días”
Nada
mejor para poner de manifiesto la ingente cantidad de datos existente que esta
impactante declaración de Eric Schmidt,
director General de Google. En la misma línea, según IBM, en 2012 el 90% de los datos que existían habían sido creados en
los dos años anteriores. Habida cuenta de la magnitud del volumen de los
datos que circulan diariamente, uno de los principales problemas radica en su
adecuado almacenamiento, que permita, a posteriori, una óptima gestión. Se ha
puesto en evidencia la necesidad de nuevos modelos de análisis e interpretación
de datos, entre los que podemos encontrar (dentro del análisis predictivo) el
datamining.
El datamining o
minería de datos, es el conjunto de técnicas y tecnologías destinadas a
explorar estas grandes bases de datos, localizando mediante el análisis
matemático patrones repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un contexto determinado, facilitando su
comprensión. Este proceso, destinado a la detección de información procesable,
se caracteriza por el empleo de estadísticas y, en algunos casos, de algoritmos
de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
En este sentido, en aras de mejorar
las actuales herramientas de que disponen los Big Data, numerosos centros de
investigación llevan años progresando en la optimización de los motores de
búsqueda. Sus esfuerzos están dirigidos a la creación de medios que permitan a
los buscadores de Internet interpretar la búsqueda introducida por el usuario a
un nivel semántico, de modo tal que los resultados que se deriven de ella puedan
inferirse en base al significado “real” (entendiéndolo asimismo como el
pretendido por el usuario), en lugar del resultado de la comparación de las
palabras que la componen. El alcance de este avance no está limitado a los
motores de búsqueda, extendiéndose a los contenidos de los sitios de Internet,
pudiendo vaticinarse que quedarán mejor posicionados aquellos que posean una
buena descripción semántica. De este modo, la mejora de la minería web será una
prioridad para los administradores de dichos sitios.
Así, son las empresas las que van a
realizar un esfuerzo en la obtención de esta información, ya que se trata de un
factor estratégico que genera una potencial ventaja competitiva al
proporcionarlas información privilegiada a través de la que pueden resolver
problemas de negocio, convirtiéndose, de este modo, en un factor clave para ellas.
Enlaces
http://es.scribd.com/doc/90626012/Analisis-Inteligente-de-Datos
No hay comentarios:
Publicar un comentario