viernes, 18 de abril de 2014

Business Intelligence (BI)

En esta entrada hablaremos sobre la inteligencia empresarial o inteligencia de negocios, en ingles Business Intelligence.
Business Intelligence es muy utilizado en la actualidad tanto en pequeñas como en grandes empresas.

En primer lugar definiremos qué es Business Intelligence.

Si además de los datos y de la información trabajamos con conocimiento, pasamos a un nivel superior de análisis denominado Business Intelligence.
El conocimiento es una mezcla de experiencia, información y know-how (expresión muy utilizada que quiere decir, saber cómo hacer algo pronto y bien hecho) que sirve como marco para la incorporación de nuevas experiencias e información, y es útil para la acción.

En general Business Intelligence es, "la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.

Desde un punto de vista más práctico, se trata de un conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales en información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa o para su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio.

Hay varias visiones de la estructura de un sistema de Business Intelligence, como por ejemplo:



Uno de los puntos de partida de un proyecto de Business Intelligence debe ser la identificación del flujo de información. Por tanto, una solución parte de los sistemas de origen de una organización sobre los que suele ser necesario aplicar una variación estructural para optimizar su propio análisis. Para ello, se realiza una fase de extracción, transformación y carga de los datos. Esta etapa suele apoyarse en un almacén intermedio, llamado ODS, que actúa como pasarela entre los sistemas fuente y los sistemas destino y cuyo principal objetivo consiste en evitar la saturación de los servidores funcionales de la organización. Los datos albergados en el datawarehouse o en cada datamart se explotan utilizando herramientas comerciales de análisis, reporting, alertas… etc. En estas herramientas se basa también la construcción de productos BI más completos, como los sistemas de soporte de decisión, los sistemas de información ejecutiva y los cuadros de mando o Balanced Scorecard.

Cómo se acaba de comentar, uno de los elementos de la estructura en el cual se encuentran almacenados datos será el Datawarehouse, que se trata de una base de datos corporativa que se caracteriza por la integración y la depuración de información de una o más fuentes distintas, para luego poder procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Será de gran utilidad a la hora de tomar decisiones. La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información. Este tipo de persistencia de la información es homogénea, fiable y permite la consulta y el tratamiento jerarquizado de la misma. Las características más importantes de la datawarehouse (o almacén de datos) son las siguientes:
  •  Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente.
  •  Temático: los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales.
  •  Histórico: el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
  •  No volátil: la información puede ser leída, pero no modificada, por lo tanto es permanente.

Otro elemento estructural a tener en cuenta por parte de la empresa es el Datamart, que podemos describir como una base de datos especializada, departamental, orientada a satisfacer las necesidades específicas de un grupo particular de usuarios.
Se puede decir que los datamarts son pequeños datawarehouse centrados en un tema o un área de negocio específico dentro de una organización. Se caracterizan por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento.

Existen varios tipos:

  •  Datamart OLAP: se basan en los cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creación, explotación y mantenimiento de los cubos OLAP es muy heterogéneo, en función de la herramienta final que se utilice.
  •  Datamart OLTP: pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es introducir mejoras en su rendimiento, aprovechando las características particulares de cada área de la empresa.

Otros elementos importantes de la inteligencia empresarial son:

 El Datamining, que son auténticas herramientas de extracción de conocimiento útil, a partir de la información contenida en las bases de datos de cualquier empresa.

El cuadro de mando integral, es una herramienta que permite alinear los objetivos de las diferentes áreas con la estrategia de la empresa y seguir su evolución.

Query & reporting, herramientas para la elaboración de informes y listados a partir de la información de los datawarehouse y datamarts.

 Los beneficios que nos aportan las soluciones de Business Intelligence son:  observar qué está ocurriendo, comprender por qué ocurre, predecir qué va a ocurrir, ver qué debería hacer el equipo y decidir qué camino hay que seguir.



viernes, 11 de abril de 2014

La recuperación de información

En esta entrada hablaremos de cómo se realiza la recuperación de la información de manera clara y amena.
La recuperación de la información consiste en acceder la información que deseamos, y que previamente está almacenada, mediante una serie de herramientas informáticas.
Estas herramientas pueden ser: bases de datos, Internet, lenguajes de indización y control terminológico....

El proceso de recuperación de información se realiza mediante una serie de consultas a la base de datos que contiene la información, a través de un lenguaje de interrogación adecuado.

Los elementos que tienen mayor grado de precisión a la hora de hacer una recuperación son los índices, palabras clave, tesauros...

El principal problema que surge a la hora de recuperar información consiste en la mucha o poca información que recuperamos. A este problema se le denomina Silencio o Ruido documental.
El silencio documental consiste cuando la información está en la base de datos pero no se ha recuperado, ya que la búsqueda ha sido muy específica.
Por el contrario el ruido documental consiste en recuperar mucha información pero que no es muy importante para el usuario, esto es debido a que la búsqueda es muy genérica.

A continuación vamos a hablar de los elementos que tienen mayor precisión a  la hora de recuperar la información:

  • Índices: es un listado de términos normalizados que representan el contenido de un recurso. Pueden ser índices de materias, alfabético, KWIC, KWOC.
  • Palabras clave: Son aquellas palabras que se necesitan, para poder encontrar la información que deseamos.
  • Tesauros: es un listado de términos controlado sobre un área de conocimiento que mantiene entre sí relaciones semánticas y genéricas. Los términos están ordenados jerárquicamente.

Para que la recuperación de información sea correcta y de calidad se tienen que llevar a cabo una serie de criterios básicos:

En primer lugar la tasa de acierto debe de ser alta, esto quiere decir que el número de documentos relevantes recuperados deben ser próximos al número total de documentos relevantes de la colección.
Otro criterio es la relevancia, donde la característica de un documento recuperado tiene que cumplir con las necesidades de información.
Precisión, son aquellos documentos relevantes recuperados.
Exhaustividad, consiste en recuperar la totalidad de los documentos relevantes que posee una colección, conforme a los requerimientos establecidos en la búsqueda.

viernes, 4 de abril de 2014

Los buscadores

En esta entrada vamos a tratar los buscadores más utilizados en la actualidad, que son google, yahoo y bing.
Aunque en España el 99% de las búsquedas se hacen a través de google, también existen otros importantes buscadores como yahoo, bing, ask.
Otros buscadores menos conocidos son: Yandex, Alibaba, Baidu, NHN Corporation, etc.

En primer lugar hay que saber qué es un buscador.
Un buscador es una página de internet que permite realizar búsquedas en la red. Su utilización es muy sencilla, ya que con sólo meter las palabras claves se generará un listado de paginas web que guardan relación con el tema solicitado.
Gracias a los buscadores tenemos la posibilidad de encontrar todo tipo de información de forma muy rápida.
Una vez que ya sabemos lo que es un buscador, vamos a ver cuales son los más conocidos y más utilizados en la actualidad.



El buscador google es el más utilizado en la actualidad con un 60% a nivel mundial.
Fue creado en 1998, y su objetivo consiste en organizar la información mundial para facilitar su acceso a los usuarios. Google permite la búsqueda personalizada, para encontrar información según los intereses de los usuarios. 
Posiblemente Google tiene tanto éxito porque ofrece decenas de productos y servicios en numerosos idiomas y además se utiliza un altísimo numero de servidores a la hora de buscar información por lo que obtenemos lo que queremos en un mínimo instante de tiempo.
Google utiliza un algoritmo denominado PageRank, cuya función consiste en organizar las páginas web que se obtienen de una búsqueda de mayor a menor importancia.
Aparte de búsquedas de información, Google también permite muchos otros servicios como por ejemplo:
  • Google docs: nos permite crear proyectos en línea y compartirlos con otros usuarios
  • Picasa: herramienta mediante la cual se comparten o editan fotografías.
  • Google maps: nos permite hacer búsquedas de alguna calle o lugar cuya ubicación no conocemos.
  • Gmail: es el correo de Google.


Otro buscador bastante utilizado en la actualidad es Yahoo, sólo superado por Google. De este buscador cabe destacar que fue el primero en ser creado en 1994.
Con Yahoo podemos personalizar las búsquedas por parte de cada usuario a través del el servicio "My Yahoo Search". Gracias a este servicio el usuario puede ir guardando los enlaces que va visitando, incluso puede añadir comentarios personales.
Al igual que Google, Yahoo cuenta con otros servicios a parte del de buscar información , como son:
  • Yahoo Mail: es el correo de Yahoo.
  • Yahoo Noticias: nos proporciona información de lo que está pasando en la actualidad.
  • Mi web Yahoo:  organiza los enlaces que más nos gustan.



Bing es un buscador web desarrollado por Microsoft. Anteriormente era conocido como LiveSearch. En la actualidad se encuentra en la 3º posición  en el ranking de buscadores más utilizados, por detrás de google y yahoo.
Bing es un motor de búsqueda que proporciona mejores resultados que otros buscadores ya que realiza una búsqueda más profunda a la hora de proporcionar resultados.
Este buscador supera a Google en que es un excelente buscador de imágenes.
Las búsquedas que se realizan en bing son simples y sencillas, se introducen las palabras claves y busca en su base de datos para devolver resultados relacionados con la búsqueda. Además también ofrece imágenes y vídeos sobre el tema buscado.


DIFERENCIAS Y SIMILITUDES:

La principal diferencia consiste en el tipo de buscador, ya que hay 3 tipos (motores de búsqueda, índices de búsqueda y metabuscadores).
En primer lugar Google y Bing se diferencian de Yahoo! en que los dos primeros son motores de búsqueda, esto es, en los que un programa que es el motor va visitando las páginas y va almacenando las direcciones de las páginas web en su base de datos. Yahoo! pertenece a los índices de búsqueda dónde la base de datos la construye un equipo humano, y las páginas web se van organizando en la base de datos por categorías en función del tema que trata.

Hay que decir que Google es la que posee la base de datos más grande, de ahí que sea el buscador más utilizado, ya que al tener una mayor base de datos proporciona mayores resultados.

Como habiamos dicho, Yahoo! pertenece a los índices de búsqueda por lo tanto proporciona la respuesta correcta al tema solicitado. En cambio Google y Bing son motores de búsqueda, por lo tanto devuelve multitud de resultados que no tienen nada que ver con el tema solicitado, ya que hacen una búsqueda en función de las palabras claves introducidas y pueden salir paginas web que no se correspondan con lo que queremos obtener.

La principal semejanza entre los 3 buscadores, consiste en que los 3 poseen búsquedas en tiempo real.



CONCLUSIÓN:
Podemos sacar la conclusión de que los buscadores nos sirven de gran utilidad en nuestras vidas cotidianas, ya que en cualquier momento podemos buscar información de forma rápida y sencilla.
Google es con mucha diferencia el buscador más utilizado, posiblemente porque es el más cómodo de utilizar a la hora de buscar los resultados, ya que introduciendo las palabras claves aparecen los resultados correspondientes.
Hay muchos buscadores, y el futuro de ellos dependerá del uso que haga el usuario.