La Web Semántica como apoyo a la Gestión de Conocimiento en Empresas de Turismo

Share Embed


Descripción

V Congreso Iberoamericano SOCOTE - Soporte del Conocimiento con la Tecnología Universidad de San Martín de Porres, 15-16 de octubre de 2013

La Web Semántica como apoyo a la Gestión de Conocimiento en Empresas de Turismo Carlos Arias Ramos1, Augusto Bernuy Alva2 [email protected], [email protected], 2 [email protected] Facultad de Ingeniería y Arquitectura, Universidad de San Martin de Porres 1

Resumen La investigación muestra el contexto actual de la Web Semántica, orientada hacia la Gestión del Conocimiento en empresas de Turismo, para proponer una innovación en tecnología de Web Semántica. Se analizan las experiencias en el turismo global y la gestión de sus diferentes elementos relacionados a sus activos de conocimiento, para evaluar el comportamiento y uso de herramientas de la Web Semántica comerciales o libres. A la vez se evalúan el estado del arte y las principales tendencias que permiten la integración de las tecnologías de Web Semántica con los Sistemas de Información de las Empresas de Turismo. Desde el punto de vista del Turista, muestra una demanda de información de lugares de interés, de planes o paquetes turísticos, que incluyan las opciones de hospedaje, restaurantes, transportes, etc. Desde el contexto de la empresa de turismo, este consiste en brindar las mejores ofertas de servicios para satisfacción del turista que contemple diferentes elecciones o sugerencias de lugares, modalidades de transporte, tipos o categorías de hospedajes, restaurantes, alternativas de entretenimiento, entre otros servicios. Finalmente, como resultado proponemos un modelo basado en gestión de conocimiento integrando la Web Semántica.

Palabras clave: Web Semántica, Gestión del Conocimiento, Recuperación de Información, Tecnologías, Turismo.

Abstract Research shows the current context of the Semantic Web, oriented to Knowledge Management in Tourism companies to propose an innovation in Semantic Web technology. We analyze the global tourism experiences and management of its various elements related to knowledge assets, to evaluate the performance and the use of commercial or free Semantic Web tools. At the same time evaluating the state of the art and the main trends enable the integration of Semantic Web technologies with Information Systems of Tourism Companies. From the tourist point of view shows a demand for information on places of interest, plans or packages that include lodging options, restaurants, transport, etc. From the context of the tourist company, this provides the best service offerings to satisfy tourists that includes different options or suggestions of places, transport modes, types or categories of accommodations, restaurants, entertainment, and other services. Finally, as a result we propose a model of knowledge management based on integrating the Semantic Web.

Keywords: Semantic Web, Knowledge Management, Information Retrieval, Technology, Tourism.

1.

Introducción

2.

Gestión del Conocimiento

3.

Entorno Empresarial de Turismo

En las empresas, el elemento humano ha adquirido relevancia. La clave actual de las empresas está en el conocimiento de la organización, y este se encuentra en las mentes de las personas que trabajan en ella y que con su experiencia contribuyen a la prosperidad de ambos. Por consiguiente es importante que los distintos grupos que conforman una organización, tengan la habilidad de aprender unos de otros y contribuir colectivamente a la solución de los problemas del día a día, identificando a su vez nuevas oportunidades de negocio que permita ser el punto diferenciador de la organización. Los sistemas de gestión de conocimiento, tienen como proceso principal encontrar las fuentes de conocimiento que son relevantes, así como el proporcionar estas fuentes para que puedan ser utilizadas en la resolución de algunos problemas. Desde un punto de vista formal del conocimiento, estas fuentes pueden dividirse en dos categorías: reglas expertas formales y documentos (multimedia). Para realizar una búsqueda eficiente del conocimiento que se tiene en la segunda categoría, el contenido de los documentos se obtiene a través de declaraciones basadas en ontologías, y estas tienen forma condicional: Condición-Acción, que permite utilizar mecanismos lógicos en la gestión en ambas categorías de fuentes del conocimiento. El PBI del sector turismo en los dos últimos años muestra una participación en la generación de riqueza del país (PBI) del 3,7%. Tabla 1. Perú: PBI del sector turismo. (Observatorio Turístico del Perú, 2012)

El gasto per cápita del turismo receptor peruano se incrementó con respecto al del año 2011 en un 6,04%. Según el Observatorio Turístico del Perú, este incremento obedeció a la reevaluación de la moneda peruana con respecto al dólar. Ello elevó el coste de las empresas que prestan servicios en el sector, cuyos costos operativos son mayoritariamente en moneda nacional, pero cuya facturación por lo general es en dólares. Tabla 2. Perú: Gasto promedio per cápita del turismo receptor en dólares corrientes. (Observatorio Turístico del Perú, 2012)

Estados Unidos de Norteamérica, lidera la relación de los diez países que captan mayores recursos monetarios por concepto del turismo receptivo. No obstante lo expuesto, el liderazgo mundial que viene mostrando China hará que probablemente en los próximos 15 años, el ingreso de visitantes y la captación de recursos financieros por dicho concepto, lo ubique en segundo o primer lugar de la relación de países que generan mayores ingresos monetarios por concepto del turismo receptivo. Tabla 3. Los 10 países con mayores ingresos por turismo receptor. (Observatorio Turístico del Perú, 2012)

4.

Web Semántica

La Web, tal como la conocemos fue realizada para humanos, contando con nuestra capacidad de entender el lenguaje natural e imágenes. He aquí el problema de la Web Semántica, de ser el medio por el cual se adaptará la Web actual a los agentes de software para que de ser posible estos puedan llegar a un punto muy cercano al humano. Este “re-nacimiento” denominado Web Semántica, se halla completamente orientado al usuario final, destinado a acrecentar enormemente su potencial de búsqueda, a maximizar las posibilidades de relacionar informacion y contar con herramientas cada vez más potentes para descubir el conocimiento. (Gurmendi, Piñeiro, & Marmonti, 2011). User Interface and applications

Trust

Proof Unifing logic

Quering: SPARQL

Ontologies:

Rules:

Taxonomies: RDFS Data interchange: RDF Syntax: XML

Identifiers: URI

Character set: UNICODE

C r y p t o g r a p h y

Figura 1. Pila de tecnologías de la Web Semántica. (Fernández López, 2010)

Según (Peset, Ferrer-Sapena, & Subirats-Coll, 2011), la diferencia entre la web del hipertexto y la web semántica es que mientras una vincula pagínas o documentos en html, la segunda va más allá del concepto documento y enlaza datos estructurados. La Web actual se basa en un lenguaje que define el “cómo” visualizar texto e imágenes en una pantalla, mientras la Web Semántica se basa en el “que” significado de los textos e imágenes que vemos en la pantalla, permitiendo de esta forma su comprensión por agentes de software mediante el uso de datos

estructurados. La Web Semántica provee una serie de tecnologías (véase la Figura 1) que facilitan la implementación de soluciones a los problemas, basándose en una arquitectura descentralizada, la Web, la Web de datos (‘Web of Data” en inglés). Universal Resource Identifiers - URI

La forma de representar los hechos, nos la proporciona (Berners-Lee, 2006) y nos da el concepto de URIs (Universal Resource Identifiers), que es un identificador de cualquier tipo de objeto o concepto. Definiendo URI, se puede decir que los URI son cadenas que funcionan como identificadores globales que hacen referencia a recursos en la Web tales como documentos, imágenes, archivos descargables, servicios, buzones de correo electrónico y otros, también conocido como URLs (Uniform Resource Locator).

Figura 2. Arquitectura de Hipertexto (Berners-Lee, 1998)

Resource Description Framework - RDF

En la web se realiza la vinculación que hay entre datos y otros recursos al igual que su publicación bajo un estándar denominado RDF (Resource Description Framework) que es un DTD (Definición del tipo de documento) de XML, con el fin de proporcionar un marco estándar para la interoperabilidad en la descripción de contenidos Web. La W3C nos indica en su documento (RDF Primer, 2004), que RDF es un lenguaje para representar información acerca de recursos existentes en la web. Está destinado especialmente para la representación de metadatos sobre recursos Web, como el título, el autor y la fecha de modificación de una página Web, los derechos de autor y licencias sobre un documento Web, o el horario de disponibilidad de algún recurso compartido. Sin embargo, al generalizar el concepto de un "recurso de la Web", RDF puede también ser usado para representar la información acerca de las cosas que pueden ser identificados en la Web, incluso cuando no pueden estar directamente recuperados en la Web.

RDF está pensado para situaciones en las que necesita esta información para ser procesados por aplicaciones. RDF proporciona un marco común para expresar esta información para que pueda ser intercambiada entre aplicaciones sin pérdida de significado. Dado que es un marco común, los diseñadores de aplicaciones pueden aprovechar la disponibilidad de analizadores RDF comunes y herramientas de procesamiento. Mediante este estándar es posible representar los hechos, como se muestra en el siguiente ejemplo: En el ejemplo, la página web situada en la URL: http://www.presidencia.gob.pe; posee un autor institucional, cuyo valor es: Presidencia de la Nación de la República del Perú. Esto podría representarse como un grafo como se muestra en la Figura 3.

Sujeto/Recurso

Objeto/Valor

http://www.presidencia. gob.pe/

Presidencia de la Nación: República del Perú

http://purl.org/dc/elements/1.1/creator Predicado/Propiedad

Figura 3. Grafo que corresponde a un Triplete RDF

El modelo RDF se puede relacionar también con el diseño orientado a objetos donde los recursos corresponden a objetos y las propiedades corresponden a ejemplos de variables. (Méndez Rodríguez, 1999). Se basa en la idea de declarar recursos usando la expresión en la forma de sujeto-predicado-objeto, también conocida en RDF como triple o triplete. Un triplete RDF contiene tres componentes, todos con referencia en un URI:

Sujeto o Recurso, una referencia URI, una persona, o un nodo, es el ente al cual nos referimos; Predicado o Propiedades, es la relación que se desea establecer acerca del sujeto; Objeto o Descripciones, es el valor de la propiedad o del otro recurso con el que se establece la relación. Tabla 4. RDF / XML Describiendo la República del Perú

Presidencia de la Nación. República del Perú

Resource Description Framework - RDF Schema

Un esquema define los términos que se utilizarán en el RDF, da a las declaraciones un significado específico para ellos. Definidos en la página de la W3C: http://www.w3.org/TR/rdf-schema/ (Resource Description Framework RDF Schema Specification, 1999). Un esquema RDF es un conjunto de informaciones relativas a las clases de recursos (vocabulario), que sirve para explicitar las relaciones jerárquicas que establecen entre ellos, o bien para matizar el carácter obligatorio u opcional de las propiedades y otras restricciones como el número de ocurrencias, etc. (Méndez Rodríguez, 1999). Por ejemplo: sí el esquema que se sigue para el registro de metadatos fuese el DC, sería de la siguiente forma: Tabla 5. RDF Schema

Las características de RDF Schema son las siguientes:

Amplía el RDF Permite definir una clasificación de recursos en términos de clases, subclases, propiedades, etc. Establece restricciones sobre las posibles combinaciones

Elementos. Resource: Todos son recursos. Class: Tipo o categoría. Las clases pueden ser subclases de otras. El tipo de un recursos debe ser un elemento de una clase. Property: Subconjunto de recursos que son propiedades. Las propiedades tienen un rango y un dominio.

SPARQL

SPARQL es un conjunto de especificaciones que proporcionan lenguajes y protocolos para consultar y manipular el contenido grafico de RDF en la Web o en un repositorio RDF. (SPARQL 1.1 Overview, 2013). Asi como en las bases de datos relacionales existe el lenguaje de consulta SQL, el cual facilita relacionar las diferentes tablas que conforman el modelos de datos y obtener una “vista” del resultado de esta consulta, es posible consultar aquellas fuentes o repositorios que contengan tripletes RDF utilizando el lenguaje de consulta SPARQL. Este sirve para: Obtener valores de fuentes estructuradas y semi-estructuradas. Explorar datos haciendo consultas a relaciones que no son conocidas a priori. Realizar uniones complejas de distintos repositorios en una consulta simple. Tabla 6. Ejemplo de consulta SPARQL

SELECT ?abstract FROM NAMED WHERE { { ?abstract FILTER langMatches(lang(?abstract),’es’)} }

Persistencia de Grafos RDF

Existen dos implementaciones de almacenes de grafos RDF, ya sea en la memoria o en un almacén persistente. Trabajar con modelos en memoria, sin embargo, tiene una desventaja importante: después de terminar la ejecución de un script, todos los modelos creados y manipulados se perderían, a menos que se guarde en un archivo. Pero incluso si se serializa a archivo, el documento que contiene datos RDF tendría que ser analizada en cualquier momento con un script que sería ejecutado y, además, el índice de búsqueda construido si se deben realizar consultas eficaces. Ambos procesos requiere mucho tiempo, especialmente cuando se trabaja con modelos en memoria grandes.

Figura 4. Modelo de persistencia de grafos RDF en Memoria y Base de Datos Relacional (Westphal & Bizer, 2004)

Para grafos RDF, existe el soporte de almacenamiento persistente de los modelos de RDF en una base de datos relacional. Con el almacenamiento de modelos RDF en una base de datos,

no solo se ahorra memoria principal, sino que además permite un rápido acceso a datos RDF usando la indexación interna y las capacidades de optimización de consultas de la base de datos. Bases de datos RDF disponibles, en software libre (Semantic Web Tools, 2010):

Sesame, es una base de datos RDF que puede ser desplegada en un amplio tipo de soportes, solo en memoria, en sistemas de archivos, en bases de datos relacionales, etc. Tiene interfaces de acceso, HTTP y Servicios web utilizando SOAP como transporte y soporta RQL como lenguaje de consulta tanto de documentos RDF como RDF-S. El soporte de SPARQL en Sesame (gracias al paquete SPARQL engine) está desde la versión 2.0. Kowari, y su trabajo derivado (“fork”) Mulgara, son bases de datos nativas RDF, transaccionales y con grandes capacidades de conectividad, servicios web, API y JRDF (la que pretende ser una estandarización de librerías de acceso a documentos RDF) no han adoptado SPARQL como lenguaje de consulta, aunque si permiten consultas a través de TQL (Tucana Query Language). Intellidimension RDF gateway, RDF comercial, es nativa, solo funciona en sistemas Windows e incluye un lenguaje de consulta basado en SQL y un servidor web para la creación de páginas web basadas en datos semánticos gracias a un lenguaje de scripting incluido en el paquete. D2RQ, trata bases de datos (generalmente relacionales) como si fuesen bases de dato RDF, programado en Java y además utiliza un lenguaje especial, D2RQ Mapping Language, para establecer las relaciones entre una ontología y un modelo relacional. RDFDB, es una pequeña base de datos RDF nativa con acceso desde Perl y/o C con un lenguaje de consulta similar a SQL. Oracle 10g, las tecnologías semánticas de Oracle 10g, persisten tripletes RDF en la base de datos, permitiendo la búsqueda utilizando PL/SQL. Joseki, no es una base de datos RDF propiamente pero si es un servidor que implementa una interfaz de consulta SPARQL para Jena. RAP, es una API que implementa RDF para el lenguaje de programación PHP, y bases de datos MySQL, permitiendo realizar consultas mediante RDQL (RDF Data Query Language).

Cómo obtener los datos Semánticos en la Web

La idea del RDF es similar a la que hay detrás del formato GRS.1 en Z.39.50, es decir, un árbol jerárquico de información dividida en identificadores etiquetados, donde el significado y el formato (marcado descriptivo y procedimental) de la marca viene definido por un conjunto de etiquetas GRS.1 o esquemas RDF. La capacidad de especificar esquemas de metadatos en RDF permitirá a las aplicaciones acceder a un esquema particular de un registro accesible públicamente vía web y recuperar la estructura y la semántica de ese conjunto concreto de elementos. Desde un punto de vista extremadamente realista, esto no asegura totalmente la búsqueda y la interoperabilidad de intercambio entre los diversos conjuntos de metadatos, pero facilita la tarea para conseguirlo. (Méndez Rodríguez, 1999). 5.

Desarrollos actuales en turismo basados en Web Semántica

KAYAK; es un Mashup turístico que integra información desde 140 sitios de viajes encontrando las tarifas más bajas. Permite comparar precios y comprar servicios directamente de aerolíneas, agencias, renta de autos y hoteles. Además, proporciona la ubicación geográfica de hoteles mediante Google maps. Esta aplicación está relacionada con este trabajo, la diferencia es que usamos una ontología de aplicación particular para describir servicios turísticos.

6.

Yahoo! Travel; es una agencia de viajes online, donde es posible encontrar vuelos, información sobre hoteles, restaurantes, guías, cruceros, paquetes vacacionales y renta de autos. También permite reservar alguno de estos servicios. HotelsCombined.com; que compara más de 800.000 ofertas de hoteles, desde treinta de los más visitados sitios web para viajes. Este sistema, ofrece valor agregado al usuario al seleccionar los sitios turísticos con más visitas y con alta calificación de los usuarios. Proyect Harmonise; es una iniciativa europea cuyo objetivo es construir un sistema basado en una ontología compartida que mejore la cooperación de empresas turísticas europeas. El propósito fue establecer un consorcio internacional Tourism Harmonisation Network (THN) conformado por los principales actores turísticos, expertos y profesionales en tecnologías de la información. La idea es discutir tópicos para el intercambio de información empleando ontologías, estableciendo un conceso para los conceptos usados en el dominio turístico europeo. Hi-Touch; tiene como objetivo, incrementar las ventas de agencias de viajes a través de herramientas de software, que brinden propuestas turísticas con la mejor oferta adaptada a las necesidades del usuario. Es decir, software que le permita a un cliente potencial seleccionar rápida y eficientemente un conjunto de productos y servicios que correspondan con sus necesidades. Estas herramientas son construidas con tecnologías como Java, XML, bases de datos ontológicas, tesauros multilenguaje y bases de datos de recursos turísticos. IM@GINE IT; está enfocado al uso de dispositivos móviles, sistemas de posicionamiento, servicios basados en localización, ontologías, integración e interoperación de tecnologías. El proyecto IM@GINE IT propone usar dispositivos como celulares y pda’s, donde dé la ubicación geográfica del usuario final.

Modelo de Gestión de Conocimiento Turistas – Empresas de Turismo

El modelo planteado está diseñado siguiendo una estructura de correlación de ofertas y demandas con base en la teoría económica. En la interrelación de varios agentes cada uno demandando la solución de alguna necesidad en particular, así como ofreciendo productos y servicios a los demás; existirán ofertas de un agente que satisfacen demandas de otro. En este caso, se propone la hipótesis de que existirá interés en mantener una relación de largo plazo, pues ambas partes estarían satisfechas. Para el caso de la interacción entre el Turista y las Empresas de Turismo se elaboró un listado de ofertas y demandas que existían para cada uno de los agentes y se encontraron los puntos en lo que existe correlación. Para evitar subjetividades en el análisis se realizó en varias empresas de turismo de Lima y únicamente se tabularon las ofertas y demandas que eran iguales entre ellas; en la Figura 5, se observa el modelo básico de gestión de conocimiento para la interacción entre el turista y las empresas de turismo. Una de las demandas comúnmente expresada por las empresas de turismo es la búsqueda de personas calificadas en alguna temática, en particular, por ejemplo, conocimientos en algún idioma común como el inglés, francés, etc. En estos casos, en los que no es fácil encontrar personal calificado que tenga conocimiento de algún tema específico, comúnmente, las empresas emprenden la búsqueda a nivel de traductores, y aun así, la búsqueda puede ser difícil, por lo que muchas veces simplemente no encuentran el personal requerido o deben pagar sumas costosas por los servicios. De acuerdo con este escenario, se observa que puede existir una correlación entre la demanda del turista de personas especializados en temas muy específicos y la oferta de planes o paquetes de turismo en tema particular requerido por la empresa. De esta manera, en el modelo planteado, las empresas a través del aplicativo en

Internet, orientan el tema del que necesitan colaboración y se realiza una búsqueda masiva dentro de los planes y paquetes de turismo desarrollados por los turistas. En los resultados aparece un listado con las coincidencias efectuadas con los datos específicos del autor del plan o paquete, sea turista o grupo de turistas. Entonces la empresa puede comunicarse con las personas indicadas para solicitar la consultoría o asesoría necesaria en el tema requerido, dada la experiencia que esa persona o grupo han adquirido a través del desarrollo del plan de turismo. El propósito de este trabajo es presentar un modelo básico para el sector turismo. El objetivo a largo plazo es construir una relación turista-empresa sostenible, lo cual solo es posible si ambas partes tienen intereses mutuos. El modelo de ofertas y demandas presentado tiene coherencia únicamente si se habilitan herramientas que satisfagan las necesidades de cada agente.

Figura 5. Modelo de gestión de conocimiento Turistas - Empresas de Turismo

Conclusiones

El desarrollo de la Gestión del Conocimiento en las empresas dependerá en el futuro de la mejora de los sistemas de almacenamiento y recuperación de la información generada diariamente, así como del desarrollo de las técnicas basadas en inteligencia artificial. El reto de la provisión automática de contenido a partir de documentos electrónicos, se enmarca desde un punto de vista tecnológico, en el área de extracción de información. La Web Semántica nos facilita compartir datos de forma masiva y estable además ayuda en su propio trabajo, como en la detección de duplicados, la desambiguación terminológica, el enriquecimiento de los datos o en suministrar su información en formatos más transparentes a los usuarios ajenos a nuestra comunidad profesional. Se debe prestar atención, ante la necesidad de interoperabilidad entre formatos, a las oportunidades que plantea el esquema RDF. La trascendencia económica, y social, del sector turístico propicia que la comunicación turística pueda ser un modelo para otros sectores a la hora de considerar sus acciones de comunicación en un medio como es Internet.

Cada vez más, la participación del usuario activa o pasivamente tiene un papel fundamental en la toma de decisiones para adquirir un producto turístico. Referencias

Resource Description Framework (RDF) Schema Specification. (03 de Marzo de 1999). Obtenido de W3C Proposed Recomendation: http://www.w3.org/TR/1999/PR-rdf-schema19990303/ RDF Primer. (2004). Obtenido de W3C Recomendation: http://www.w3.org/TR/2004/RECrdf-primer-20040210/ Semantic Web Tools. (14 de Enero de 2010). Obtenido de http://www.w3.org/wiki/SemanticWebTools#RDF_Triple_Store_Systems Observatorio Turístico del Perú. http://www.observatorioturisticodelperu.com/

(2012).

www.w3.org:

Obtenido

de

SPARQL 1.1 Overview. (21 de Marzo de 2013). Obtenido de W3C Sparql: http://www.w3.org/TR/sparql11-overview/

Berners-Lee, T. (Enero de 1998). World Wide Web Consortium (W3C). Obtenido de El modelo Web: Identificadores Universales de Recursos: http://www.w3.org/DesignIssues/Model.html Berners-Lee, T. (27 de Julio de 2006). World Wide Web Consortium (W3C). Obtenido de Linked Data: http://www.w3.org/DesignIssues/LinkedData.html

Fernández López, S. (Julio de 2010). TRIOO, estudio e implementación de modelos de datos RDF en lenguajes orientados a objetos. Obtenido de http://trioo.wikier.org/resources/doc/trioo-tfm.pdf Gurmendi, M. d., Piñeiro, I., & Marmonti, E. (24-30 de Octubre de 2011). Acceso Abierto. Obtenido de Jornada Internacional de Acceso Abierto Argentina 2011: http://accesoabiertoargentina.caicyt.gov.ar/files/biblioteca/Ponencia_Pineiro-MarmontiGurmendi.pdf

Méndez Rodríguez, E. (1999). RDF: un modelo de metadatos flexible para las bibliotecas digitales del proximo milenio. Obtenido de 7a Jornadas catalanes de documentación: http://eprints.rclis.org/12694/1/RDF_7JC99.pdf

Peset, F., Ferrer-Sapena, A., & Subirats-Coll, I. (07 de Marzo de 2011). El profesional de la Información. Obtenido de Open Data y Linked Open Data: Su impacto en el Área de Bibliotecas y Documentación: http://www.elprofesionaldelainformacion.com/contenidos/2011/marzo/06.pdf Westphal , D., & Bizer, C. (Octubre de 2004). Tutorial de RAP API para PHP. Obtenido de RAP API: http://wifo5-03.informatik.uni-mannheim.de/bizer/rdfapi/tutorial/

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.