Aperfeiçoando a Interação entre Estudantes de Medicina e Máquinas de Busca

Share Embed


Descripción

Aperfeiçoando a Interação entre Estudantes de Medicina e Máquinas de Busca Adriano Ricardo Duma1, Luciana Bandeira Mendes Ribeiro1, Thaís Ariela Machado1, Guilherme Nunes Nogueira-Neto2, Percy Nohama1, Roosewelt Leite de Andrade1 1

Laboratório de Engenharia de Reabilitação (LER), Pontifícia Universidade Católica do Paraná (PUCPR), Brasil 2 DEB, FEEC, Universidade Estadual de Campinas (UNICAMP), Brasil

Resumo - Este artigo procura identificar dificuldades encontradas por estudantes da área médica na busca de informação técnica de medicina. O objetivo principal é mostrar a importância da recuperação de informação na área médica por meio de máquinas de busca e do Sistema Morphosaurus. Aplicou-se um questionário contendo perguntas pertinentes à área médica a alunos do curso de medicina, visando mensurar o seu conhecimento em informática, idioma inglês e portais para busca de informações. A partir dos resultados, discutem-se formas pelas quais as máquinas de busca podem prestar apoio direcionado a profissionais da área de saúde. Palavras-chave: Máquinas de Busca, Informática Médica, Recuperação de Informações Translíngüe. Abstract - The aim of this paper is to identify difficulties of medicine students in the search of medical information. The main objective is to present the importance of information retrieval in the medicine domain using search engines and Morphosaurus System. A questionnaire with issues pertinent to the medical domain was applied to students of medicine course, intending to measure their knowledge on computer science, english language and information retrieval websites. From the obtained results, the authors discuss the directions the search engines can provide specific support for health professionals. Key-words: Search Engine, Medical Informatics, Cross-Language Information Retrieval.

Introdução Os avanços na medicina estão intimamente ligados ao progresso que se verificou na área da informática, com o desenvolvimento dos computadores e de softwares cada vez mais apropriados ao usuário [2]. A aplicação da informática na área médica vem se expandindo em escala cada vez mais ampla na grande maioria dos países [1]. Apesar do seu emprego ainda ser recente, as vantagens da aplicação de tal ferramenta de trabalho são evidentes, com progressivo e generalizado aproveitamento adaptado às necessidades do médico e da medicina [2]. A Internet tornou acessível diversos produtos e serviços que atualmente encontram-se à disposição do médico. A divulgação da Internet como veículo de distribuição de informação incentiva a elaboração de programas médicos para utilização através da rede [1]. Entre as aplicações, destaca-se o ensino ou a educação médica. Efetuando uma consulta aos sites

disponíveis na Internet, é possível ter acesso a protocolos clínicos, terapêuticos e de investigação, casos clínicos e também artigos completos ou resumos de artigos provenientes de sociedades científicas e organizações de saúde [3]. Contudo, o acesso à informação vasta e diversificada pode ser demorado e até mesmo difícil, especialmente quando se navega sem objetivos definidos. É preciso ter noção da relativa confiabilidade da informação encontrada, já que a responsabilidade, na maioria das vezes, é apenas de quem a coloca no site e, portanto, com critérios de seleção variáveis [4,5]. Neste contexto, surgem as máquinas de busca (MB) para facilitar e otimizar o acesso às informações disponíveis eficaz e rapidamente [6]. A função principal das MB é indexar os documentos existentes em uma base e classificar os selecionados como relevantes para uma dada pesquisa. Porém, a descoberta dos documentos relevantes normalmente é suportada pela área de processamento da linguagem natural (PLN). Portanto, a recuperação de documentos relevantes

por MB sem o referido suporte não será tão satisfatória, haja vista a complexidade da terminologia da medicina. Neste artigo, descreve-se uma avaliação de conhecimento aplicada aos graduandos de medicina na PUCPR referente ao uso de MB e suas ferramentas. Inquiriu-se, por exemplo, o conhecimento de filtros de MB, o vocabulário em inglês, assim como o interesse na utilização de uma MB específica para a área de saúde. Espera-se, a partir dos resultados, expor as dificuldades enfrentadas pelos usuários da área de medicina e, com isso, sugerir especificações mínimas para uma ferramenta que contribua com o desempenho na recuperação de documentos médicos relevantes para a sua pesquisa. Metodologia O trabalho consiste de uma pesquisa de campo mediante a aplicação de um questionário (contendo 7 perguntas objetivas, sendo que 4 perguntas admitem uma ou mais respostas) que envolveu 269 alunos do curso de Medicina, do 2º ao 9º período, da PUCPR. Deu-se ênfase aos períodos iniciais do curso devido à alta incidência de buscas via Internet para a realização de pesquisas com intuito informacional, além de trabalhos e projetos científicos. Por meio do questionário, avaliou-se o emprego de MB para pesquisa com a identificação das mais empregadas, o conhecimento da existência de filtros para direcionar a pesquisa, apontando os mais utilizados e a avaliação do aluno quanto à melhora da precisão da busca com o uso dessa ferramenta. Tendo em vista a imensa quantidade de informações disponíveis em inglês, ainda foi inquirido o nível de conhecimento nessa língua. Inseriram-se algumas palavras com grafia incorreta, e falsos cognatos com o intuito de avaliar a noção do vocabulário técnico (neste caso, médico) dos alunos entrevistados. As perguntas contendo falsos cognatos aceitavam mais de uma resposta. A última questão refere-se ao interesse do aluno no desenvolvimento de uma MB que facilite a pesquisa utilizando busca translíngüe. Resultados As MB utilizadas pela maioria dos alunos para pesquisa científica são: Google com 82% das marcações, seguida do Medline (45%), Scielo (22%), Yahoo (16%) e Pubmed (12%), lembrando que esta pergunta aceitava mais de uma resposta. Quanto ao uso de filtros para aprimorar a busca, muitos alunos relataram não saber utilizar

este recurso (21%). Dentre os que utilizam tal ferramenta, 34% julgam haver melhora na busca em um nível bom, 22% regular e 7% julgam excelente a ferramenta. Segundo a pesquisa, os filtros mais utilizados foram: aspas (53%), seguidas dos sinais de inclusão e exclusão (+/-) com 21% e AND/OR (e/ou) com 18% das respostas. Quando inquiridos quanto à leitura em idioma inglês, relatam estar em nível intermediário 46%, avançado 26% e básico 21%. Quanto ao vocabulário técnico, no caso médico, 55% relatam possuir conhecimento básico, 32% intermediário e apenas 5% se consideram em nível avançado. Nos exemplos com termos grafados incorretamente, os acertos foram os seguintes: • artrite: arthritis 57% • escoliose: scoliosis 50% • cerebelo: cerebellum 51% • fibrinólise: fibrinolysis 48% • gesso: plaster 49% • hemodiálise:hemodialysis 54% • distrofia: dystrophy 15% • psicossomático: psychosomatic 38% • leptomeninges: leptomeninges 26%. Dentre os falsos cognatos apresentados (nesse item, mais de uma resposta correta era aceita), as respostas foram: • Gripe: influenza 55%, cold 26%, flu 52%, grip (5%); • Dor de Cabeça: headache 87%, brain pain 5%, migraine 25%, figurehead 1%; • Preservativo: preservative 17%, condom 70%, conservative 12%, contraceptive 28%. Dentre os entrevistados, 89% (239 alunos) responderam que seria interessante o desenvolvimento de uma MB em português, onde o sistema retornasse documentos (do mesmo assunto) em outras línguas e vice-versa (idiomas selecionáveis) – portanto, busca translíngüe. Discussão e Conclusões As MB surgiram para auxiliar o usuário na obtenção de informações que se encontram disponíveis na rede. Apesar das várias tecnologias desenvolvidas nos últimos 20 anos para a recuperação de documentos relevantes, as atuais MB (comerciais) ainda não são plenamente eficazes para satisfazer a necessidade de informação desejada por grande parte dos usuários da área de saúde. Ainda há limitações, como a grande quantidade de documentos relevantes não encontrados e os irrelevantes apresentados.

Na pesquisa científica, muitas vezes a informação que se deseja reside em servidores institucionais de universidades, associações de classe ou governamentais. Porém, muitos links apresentados na resposta de MB multipropósito apontam para websites comerciais ou patrocinados, não necessariamente de interesse devido às eventuais informações tendenciosas. Isso não ocorreria no caso de MB totalmente voltadas à área de saúde, pois a sua base de dados já deve ter sido previamente escolhida na montagem do seu corpus. Para uma MB multipropósito, a solução seria empregar filtros de servidor como, por exemplo: • mais genéricos {inurl:gov} ou {inurl:edu} • mais específico {site:saude.gov.br}. O uso desse artifício dependeria da habilidade do usuário em saber empregar adequadamente tais filtros, o que não favorece o profissional da saúde. Ainda existe a agravante da informação desejada residir em servidores de outros países, em páginas escritas em outros idiomas. Portanto, seria extremamente interessante aliar a MB a algum sistema de pré-processamento de conteúdo, de forma a melhorar a resposta do sistema no que tange à recuperação dos documentos relevantes. Em sistemas de recuperação de informação, o parâmetro ‘precisão’ é definido como a relação entre a quantidade de documentos considerados relevantes (dentro de um conjunto pré-definido) e a quantidade total de documentos retornados pela MB em resposta a uma pesquisa efetuada. Aumentar o valor desse parâmetro é importante porque o usuário tem interesse em adquirir o maior número de documentos relevantes, isto é, documentos que satisfaçam a sua necessidade de informação. A partir dos resultados, concluiu-se que, em linhas gerais, os acadêmicos encontram-se despreparados para lidar com as oportunidades geradas pela informática, tais como uso de MB ou acesso à Internet. Além disso, muitos usuários possuem conhecimento de outros idiomas como o inglês. Entretanto, algumas vezes a busca torna-se dificultada pela presença de falsos cognatos bem como o desconhecimento de vocabulário técnico que pode levar o usuário à não obtenção de conteúdo correto. Sempre que se realiza uma busca empregando quaisquer MB, existe a possibilidade de incorrer em erro de sintaxe. Apesar de que as atuais MB fornecem sugestões de alteração de grafia quando o usuário escreve incorretamente, o problema persiste quando se trata de um falso cognato escrito incorretamente em outro idioma. Observa-se para uma das MB mais empregadas no planeta: ‘desfibrilation’ – retorna 95 resultados.

Sabe-se que a grafia está incorreta, mas a MB não informa sugestão de alteração e o usuário deixa de acessar 1610000 links para o termo defibrillation. Para o usuário mais incauto, esse é um grande problema. Nota-se, portanto, o desejo de uma ferramenta multilíngüe e é nesse contexto que se propõe a utilização do sistema Morphosaurus. O projeto Morphosaurus vem sendo desenvolvido desde 2002 em parceria com a Universidade de Freiburg, Alemanha, e recebendo apoio do CNPq e do DLR [5, 7]. Trata-se de um sistema de recuperação de informações translíngüe baseado num tesauro que reúne classes de unidades semanticamente atômicas que sejam representativas da terminologia médica para a indexação e recuperação de informações textuais. Com base nessas classes, o Sistema Morphosaurus mapeia tanto os termos da expressão de busca quanto o conteúdo dos documentos para uma linguagem independente, denominada MID (Morphosaurus Identifier), de forma que o significado das palavras prevalece sobre a sua presença no texto. Dessa forma, é possível recuperar, por meio de MB, documentos em outras línguas informando a expressão de busca, ou query, na língua nativa, sem a necessidade de utilização de filtros. Quando um usuário efetua uma pesquisa, ele tem como resultado links para páginas que tratam do contexto que satisfaz a expressão de busca. As buscas são diretas e relevantes, levando em consideração apenas textos e sites considerados de maior relevância para a área de saúde, facilitando o uso da informação disponível na Internet para a educação médica. Esse é o modo de operação mais básico do Morphosaurus. Entretanto, existe ainda, com base na abordagem por subword, outra característica de apoio à MB. Através da proposta de uma interface web, conforme Daumke et al., o Sistema Morphosaurus possibilita que a query repassada pela MB seja tratada de forma a expandir-se em outros termos ou frases semanticamente semelhantes e devolvidas à MB na língua nativa [7]. Essa expansão melhora a cobertura sobre os documentos relevantes e, desse modo, melhora o parâmetro precisão. Outra vantagem do sistema Morphosaurus relaciona-se ao tratamento de erros de grafia, principalmente, os de sufixação e de partículas invariantes na formação de palavras. Para a MB multipropósito mais popular do mercado, com filtro de seleção de idioma configurado para o inglês, os dois seguintes termos pesquisados retornaram links para os mais variados tipos de documentos e não propõe alteração de grafia: ‘cefaleia’ – 506 e ‘cefalea’ – 20000 [7]. Empregando o Morphosaurus, o sistema normalizará ‘cefalea’, ‘cefaléia’ e ‘dor de cabeça’ do mesmo modo como exposto na Figura 1:

Referências

Figura 1: Normalização dos termos ‘cefalea’ e ‘cefaléia’ pelo Morphosaurus. Se não por normalização direta, o Morphosaurus encontrará ‘cefalea’ no idioma inglês por meio de expansão de termos. Profissionais da área de saúde também podem ser acometidos por estresse como a síndrome de Burnout ou problemas de dislexia. A pesquisa com a MB multipropósito retornou páginas de resultados com 103000 e 54000 links [9] para buscas pelos termos ‘abscesso’ e ‘abcesso’, respectivamente, que são comumente encontrados em documentos médicos. A Figura 2 mostra que o sistema Morphosaurus normaliza os dois termos em um mesmo conceito semântico.

Figura 2: Normalização dos termos ‘abscesso’ e ‘abcesso’ pelo Morphosaurus Conforme indicado nas figuras 1 e 2, pequenas variações na grafia de determinados termos não se tornam empecilho para a recuperação do conceito semântico a ser pesquisado. Tendo em vista a dificuldade dos alunos na utilização dos recursos disponibilizados pelas MB, tanto devido à má formulação das queries quanto ao domínio limitado de outros idiomas, conclui-se que a interface Web proposta pelo sistema Morphosaurus é uma ferramenta muito útil na compensação dessas dificuldades. Pois, a partir do momento em que a query é repassada ao sistema, todos os problemas mencionados são minimizados. A natureza da orientação a conceito do sistema não só ameniza as dificuldades técnicas e até mesmo físicas dos usuários, como também se prova uma ferramenta global para integração de culturas, pois documentos escritos em português de Portugal são recuperados juntamente com textos em português do Brasil (contacto/contato – óptico/ótico). Agradecimentos Os autores agradecem ao CNPq pelo apoio financeiro e bolsas destinados à realização deste projeto.

1. Cal RGR; Maluf MA; Branco JNR.; Buffolo E; Guidelines to decision - making in congenital heart disease on the WEB interface: Tricuspid Atresia model. Rev Bras Cir Cardiovasc. [online]. Apr. 1999, vol.14, no.2 [cited 13 July 2006], p.144-155. Available from World Wide Web: . ISSN 0102-7638. 2. Perdigão C, “Medicina, Informática e Internet” (1998), Revista da Faculdade de Medicina de Lisboa, III (4) 211-213. 3. Potts JF (1998), “Obtenha o máximo do seu browser”, Prograduate Medicine; 9: 9-10. 4. Goldwein JW, Benjamin I (1995), “Internet-based medical information: time to take charge”, Ann Intern Med.; 123: 152-3. 5. Schulz S, Nohama P, Borsato EP, Matias L.J.D. (2004), “Indexação e Recuperação Aumtomática de Textos Médicos”, Departamento de Informática, Universidade de Freiburg (Alemanha) http:// www.imbi.uni-freiburg.de/medinf/mie_home.htm. 6. Morais EF, Soares MB, Web semântica, Universidade Federal de Minas Gerais: http://homepages.dcc.ufmg.br/~nivio/cursos/pa03/se minarios/ 7. Daumke P, Schulz S, Markó K, 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 2005. 8. http://www.google.com.br . Acessado em 17 de julho de 2006. Contato Adriano Ricardo Duma Pontifícia Universidade Católica do Paraná Laboratório de Engenharia de Reabilitação Rua Imaculada Conceição, 1155 – Prado Velho. Telefone: (41) 3271-2446 CEP: 80.215-901 Curitiba – Paraná – Brasil Email: [email protected]

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.