Framework para Compartilhamento de Imagens Médicas

June 14, 2017 | Autor: Sergio Furuie | Categoría: Medical Image
Share Embed


Descripción

X Congresso Brasileiro de Informática em Saúde

Framework para Compartilhamento de Imagens Médicas Marcelo dos Santos1, Sérgio S. Furuie2 1

Unidade de Pesquisa e Desenvolvimento do Serviço de Informática Instituto do Coração (InCor-HC-FMUSP), Brasil 2 Escola Politécnica da Universidade de São Paulo (EP-USP), Brasil

Resumo - Este artigo apresenta uma infra-estrutura para tornar disponível uma base multimodal de imagens médicas para uso em diferentes propósitos. A infra-estrutrura contempla uma base de imagens de arquitetura distribuída, ferramentas para autoria, repositórios de documentos multimídia e um modelo de revisão por pares que assegura a qualidade dos conjuntos de dados. Este repositório público pode representar mudanças fundamentais na cultura e facilitar o desenvolvimento de pesquisas em imagens médicas. Palavras-chave: Imagem Médica, Base de Imagens Médicas, Arquivo Didático Digital, Base Distribuída. Abstract – This paper presents a framework to make available a free online, multipurpose and multimodality medical image database. The framework implements a distributed architecture for medical image database, authoring tools, and a repository for multimedia documents. Also it includes a peer-reviewed model that assures quality of dataset. This public repository of medical image data can facilitate and change the culture of the development of medical imaging research. Key-words: Medical Image, Medical Image Database, Digital Teaching File, Distributed Database. • Usualmente, os métodos de processamento de IM desenvolvidos em trabalhos acadêmicos (iniciação científica, mestrado e/ou doutorado) são testados em IM adquiridas a partir de uma única fonte e/ou segundo um protocolo. Logo, tais método tendem ser “otimizados” para estes dados. • Dificuldade para elaborar quadro comparativo com outros métodos (incompatibilidades dos dados de teste); • O tamanho do conjunto de dados utilizado nos testes pode não representar uma amostra significativa de casos clínicos e patologias; • Ausência de informações sobre as condições de aquisição das IM de teste; • Qualidade e/ou validade dos gold-standards e dados utilizados nos testes; • Falta de documentação dos procedimentos adotados em testes e • Dificuldades para reproduzir métodos criados por terceiros, avaliá-los e compará-los. Nesse contexto, torna-se de grande valia uma base de dados sobre IM que contemple IM de diferentes modalidades e regiões anatômicas, informações de diagnóstico, gold-standards de fontes confiáveis, descrição dos procedimentos adotados em testes, documentação dos métodos, lista de IM utilizadas nos testes de validação, comparação com outros métodos, implementações (arquivos binários e/ou fontes), IM pós-processadas e referências bibliográficas. E, adicionalmente, condições para recuperar e organizar os conteúdos de diferentes modos.

Introdução Desde o surgimento dos primeiros métodos de processamento de imagens, as pesquisas nessa área têm crescido continuamente. De modo especial, o processamento de imagens na Medicina tem tido cada vez mais importância: diferentes abordagens têm sido utilizadas por radiologistas, clínicos e fisiologistas com a finalidade de elucidar as informações contidas nas imagens médicas (IM) e maximizar a precisão do diagnóstico[1]. O uso das IM como ferramenta pervasiva de auxílio ao diagnóstico deve-se, em grande parte, às tecnologias associadas aos métodos de aquisição e manipulação dos dados contidos nessas imagens[2]. Atualmente, o processamento de imagens constitui uma linha de investigação em diversas áreas, dentre elas Informática Médica e Engenharia Biomédica. Freqüentemente, novos métodos de processamento de IM são apresentados. Porém, poucos têm alcançado alto grau de usabilidade e provado sua eficácia no domínio clínico. Uma das razões é que poucos deles são devidamente avaliados e exaustivamente testados[3]. Um dos obstáculos presentes no desenvolvimento de métodos de processamento de IM é a falta de conjuntos de dados para ampla avaliação desses métodos. Usualmente, cada desenvolvedor adquire e organiza seu próprio conjunto de dados de testes. Com isso, são comuns os seguintes problemas:

621

X Congresso Brasileiro de Informática em Saúde

De acordo com Vannier[4], a criação, expansão e integração dos diversos arquivos de IM têm se tornado atividades necessárias para o aprimoramento de muitas áreas. Este trabalho apresenta o desenvolvimento de uma infraestrutura de base distribuída de IM. O objetivo consiste em disponibilizar uma grande base de dados sobre IM para uso em diferentes propósitos, com suporte ao armazenamento de IM de várias modalidades e regiões anatômicas.

a) O Conceito Os principais objetivos do projeto resumem-se em: (a) criar e manter uma infraestrutura escalável e distribuída de base de dados sobre IM; (b) prover acesso aos repositórios da infra-estrutura por meio de navegadores de Internet; (c) armazenar, além de IM, documentos, softwares, imagens pósprocessadas, anotações e sinais; (d) acessar o conteúdo de outras bases de IM e (e) promover e manter relacionamentos entre pessoas, grupos e instituições que trabalham com IM. Conceitualmente, estas características são apresentadas na Figura 1.

Metodologia O

projeto

foi

desenvolvido

visando

Figura 1 – Visão conceitual da base de IM. Uma vez que foi previsto o acesso por um grande número de usuários, cada usuário possui um papel e, a cada papel, está associado um conjunto de operações permitidas. As autorizações de acesso são avalizadas por um serviço de controle de acessos, baseado em papéis e sensitivo ao contexto do usuário. Como mencionado, a infra-estrutura deve suportar o armazenamento de diferentes tipos de IM, obtidas em diferentes condições e contextos clínicos. Para tanto, destacam-se: • Identificação única dos conjuntos de dados; • Ferramentas para pesquisa e recuperação; • Arquivamento de análises, de forma a propiciar comparações e novas análises;

integração de diferentes repositórios de IM, resultando numa arquitetura de base distribuída que inclui: (a) ferramentas de autoria; (b) repositório de IM, documentos, softwares, anotações e sinais; (c) ferramentas de pesquisa e recuperação; (d) controle de acessos; (e) interface para pesquisa e recuperação de dados de bases públicas de IM, externas à infraestrutura. Todo o projeto foi desenvolvido 1 2 baseado em padrões abertos (DICOM , XML , entre outros), modelado utilizando Unified 3 Modeling Language (UML ) e implementado utilizando ferramentas de uso livre para 4 5 6 desenvolvimento (Java , JBOSS , PostgeSQL , entre outras). 1

http://www.nema.org http://www.w3c.org 3 http://www.uml.org 4 http://www.java.sun.com 2

5 6

622

http://www.jboss.org http://www.postgresql.org

X Congresso Brasileiro de Informática em Saúde

• Transparência na localização física dos dados e locais onde as requisições são processadas; • Ferramentas para visualização e autoria; • Acesso multiusuário, subsidiado por políticas de acesso e autenticação; • Ferramentas para anonimização; • Interface para acomodar novas funcionalidades na forma de plug-ins e • Ferramentas para revisão e certificação dos conjuntos de dados.

conectado à infra-estrutura, viabilizando compartilhamento dos conteúdos.

b) Arquitetura da Base de IM Neste projeto foi adotada uma abordagem de base distribuída de IM caracterizada por uma arquitetura que viabiliza a separação/replicação física e a integração lógica de porções da base. Adicionalmente, a arquitetura foi projetada de modo a suportar pesquisa e recuperação de informações a partir de outras bases de IM de 7 acesso público e uso livre, como: MIRC-RSNA , 8 9 10 myPACS.net , BIRN e MAMOGRID . A idéia central é que esta infra-estrutura funcione como um “barramento”, onde os vários repositórios de IM (sites) são conectados (Figura 2). Todos os sites são visíveis por meio de um servidor web, mimetizando um grande portal, pelo qual os usuários acessam de forma transparente os conteúdos dos sites. Além de realizar a integração dos diversos locais de armazenamento, a arquitetura também suporta pesquisa e recuperação de dados a partir de bases de IM externas à infra-estrutura. A abordagem proposta permite que diferentes grupos possam criar seus próprios repositórios de IM (sites), com total controle no que tange a organização dos conteúdos. Contudo, é condição que cada site esteja

Figura 2 – Visão geral do modelo distribuído. Cada site é uma base de IM autônoma provida de todas as funcionalidades. Objetivando escalabilidade dos serviços, cada site está subdividido em componentes de serviço que realizam tarefas espec íficas. Os principais componentes (Figura 3) são: (1) gerenciador de meta-informações; (2) controle de acessos baseado em papéis; (3) sistema de gerenciamento de arquivos em disco; (4) ferramentas de editoração, pesquisa e recuperação; (5) ferramenta para validação e certificação dos materiais submetidos; (6) repositório de interfaces e broker para acesso a outras bases de IM e (7) servidor de páginas web. A arquitetura ainda contempla um serviço de controle de acessos central que autentica os acessos, valida operações permitidas, autoriza recuperação de conjuntos de dados, detecta contextos e controla de sessões. Nesta abordagem, a arquitetura e a infra-estrutura

7

http://mirc.rsna.org http://www.mypacs.net 9 http://www.birn.net 10 http://mammogrid.vitamib.com 8

o

Figura 3 – Componentes de cada site.

623

X Congresso Brasileiro de Informática em Saúde

utilizando qualquer dos dicionários presentes na infra-estrutura. Assim, as buscas podem ser feitas tanto por códigos quanto por texto livre.

possuem as seguintes características: escalabilidade, autonomia de cada repositório, extensibilidade (adição de novos serviços na forma de plug-ins) e controle de versão dos componentes da aplicação e conteúdo dos sites. c) Modelo de Dados O armazenamento de IM é mais do que criar uma estrutura de dados capaz de armazenar informações pictoriais[1]. Envolve, também, o armazenamento de um conjunto de informações associadas às IM. Exemplificando, para análise completa de um estudo clínico (exame com IM) faz-se necessária uma variedade de informações, incluindo: (a) condições do paciente e informações demográficas; (b) condições da realização do estudo; (c) características da IM gerada e (d) técnica e parâmetros utilizados na aquisição. Adicionalmente, para bases de IM, subsistem uma quantidade de peculiaridades que tornam crítico o gerenciamento desse tipo de dado. Algumas dessas peculiaridades compreendem: heterogeneidade da natureza e conteúdo das IM, dificuldade de sistematizar o conhecimento clínico, tamanho do volume de dados, necessidade de ter um grande número de casos para obtenção de inferência estatística significativa, o contexto da aquisição e natureza confidencial da informação clínica. Na criação de um modelo de dados flexível para IM e informações associadas, além das peculiaridades elencadas, também foram considerados: (1) organização de múltiplos repositórios; (2) coleção de documentos multimídia; (3) dicionários clínicos para codificação de patologia e anatomia; (4) ontologias para descrição dos conjuntos de dados; (5) remoção de informações identificativas e ferramentas para edição de IM e (6) suporte a documentos DICOM Structured Report[5]. Neste projeto foi adotado o conceito de templates, onde cada material armazenado é inserido seguindo a especificação de uma template e esta mesma template é utilizada para formatar a apresentação do material quando este é recuperado. Dessa forma, tem-se uma interface genérica (Figura 4) que encapsula um conjunto de objetos de informação. Cada objeto de informação possui um visualizador (viewer), disponível como um plug-in, encarregado de fazer a apresentação do objeto de informação. Com isso, a instância de uma template é formada por um conjunto de objetos de informação específicos e esta instância representa um tipo de material contido na base. Para armazenar certos conjuntos de informações de modo padronizado, o modelo suporta o uso de dicionários como ACR, CID 10, SNOMED, RSNA-RadLex, entre outros. Quando se insere um novo material, pelo menos a região anatômica e patologia devem ser codificadas

Figura 4 – Modelo de dados.

d) Implementação e Funcionamento O conjunto de aplicações foi desenvolvido em Java (J2EE, EJB, JDBC, JSP), Xerces XML e o gerenciador de banco de dados PostgreSQL versão 8.0. As etapas da construção da base de IM foram: (a) desenvolvimento de infra-estrutura de base de dados distribuídos; (b) interface para suporte a componentes na forma de plug-ins; (c) ferramentas de autoria, busca e recuperação; (d) serviço de controle de acessos; (e) ferramenta para validação e certificação dos materiais submetidos e (f) repositório de interfaces e broker para recuperar dados a partir de outras bases. Cada site implementa um modelo clienteservidor, baseado em três camadas: (1) persistência, (2) aplicação e (3) apresentação. Um servidor central garante a funcionalidade da aplicação como um grande portal. Por razões de segurança, este servidor também é responsável pelo registro e autenticação dos usuários e bases conectadas à infra-estrutura, bem como pelo recebimento das requisições de pesquisa e sua distribuição entre os pares. A inserção dos materiais pode ser iniciada numa sessão, esta sessão ser finalizada e, em outro momento, continuar a edição do ponto em a sessão foi finalizada. Os materiais nessas condições podem ser visualizados pelos demais usuários, porém com o status “em elaboração”. Somente quando o usuário-autor finaliza a edição é que este material será encaminhado para revisão, passando a ser visualizado com status “em avaliação”. Após a revisão do moderador, o status poderá ser: “aprovado”, “rejeitado” ou “com pendências”. Neste último, o material volta para o autor e o status passa a ser “em revisão”, até que ele o submeta novamente para avaliação. A recuperação baseia-se no seguinte fluxo: (1) o usuário submete a requisição de busca (conjunto de critérios); (2) o servidor recebe e processa esta requisição, retornando as IM e anotações associadas e, finalmente, exibe as IM como thumbnails; (3) a partir da lista de

624

X Congresso Brasileiro de Informática em Saúde

criação de um campo de testes de todo o projeto, incluindo a validação da ferramenta de população automática da base. Por meio desse teste de carga, foi possível avaliar a robustez do sistema, principalmente no que tange a manipulação de grandes conjuntos de dados e escalabilidade da aplicação para armazenar IM de diferentes modalidades e patologias. Foi instalado um repositório no Instituto de Radiologia (InRad-HCFMUSP) para que

resultados, o usuário pode solicitar a visualização das IM na resolução original. Ainda, na recuperação, o usuário pode optar por fazer o download do material. As Figuras de 5 a 8 apresentam algumas telas da aplicação, incluindo a apresentação do caso clínico (Figura 5), lista de IM pertencentes ao caso clínico (Figura 6), visualizador de IM (Figura 7) e as ferramentas para manipulação e visualização de IM (Figura 8).

Figura 5 – Apresentação do caso clínico.

Figura 6 – Lista de thumbnails do estudo. (possibilidade de visualizar IM dinâmicas).

Figura 7 – Visualizador de IM[6].

Figura 8 – Ferramentas de visualização e de anotação em IM. residentes da especialidade de neuro-radiologia fizessem testes e incluíssem casos clínicos, compondo o arquivo didático digital do Instituto. O acesso aos dados pode ser feito pelos usuários cadastrados, a partir de qualquer computador conectado à rede do Instituto. Os residentes validaram a aplicação, principalmente a interface gráfica e facilidade de uso. Algumas alterações foram solicitadas, implementadas e disponibilizadas. Apesar do pequeno volume de dados contidos na base de IM do InRad (aproximadamente 120 casos), esta atividade, além de marcar o início da criação do arquivo didático digital do Instituto, também serviu para criar um site externo a fim de validar a abordagem de base distribuída de IM. Um resultado interessante foi que durante o desenvolvimento, observamos a existência de várias bases de IM, a maioria delas com finalidades bastante específicas. Assim, optamos por não ser apenas “mais uma base de IM” a estar disponível, mas por integrar conteúdos. Os mecanismos para interrogar e recuperar dados a

O conjunto de operações – inserção, exclusão e disparar processamento remoto – é oferecido a certos usuários por meio de políticas definidas no serviço de controle de acessos. Por exemplo, a inclusão de um novo caso clínico ou método de processamento de IM é permitida a todos os usuários, porém a exclusão é permitida somente ao proprietário da informação submetida (antes da validação desta pelo moderador) ou pelo administrador do sistema. De modo similar, a certificação somente poderá ser realizada pelos moderadores.

Resultados Atualmente, a base de IM conta com cerca de 450 exames completos (IM e laudos), inseridos a partir do PACS-InCor. Tais exames foram adquiridos a partir das modalidades de angiografia por raio-X, ressonância magnética, tomografia computadorizada e ultra-sonografia. Estes dados serviram, inicialmente, para a

625

X Congresso Brasileiro de Informática em Saúde

partir de outras bases nos permitiu reunir grande quantidade de dados, fazendo com que num período de tempo muito pequeno (poucos minutos) o número de casos clínicos disponíveis aumentasse de cerca de 570 para alguns milhares. Outro aspecto relevante é a compatibilidade com o Medical Image Resource Center (MIRC) da RSNA, que atualmente tem sido bastante utilizado pela comunidade e tende a ser um padrão. Isso tudo evidencia a robustez do modelo distribuído aqui apresentado. Vale também destacar a inserção do modelo de revisão dos casos clínicos. Diferentemente do que ocorre em muitas bases de IM, esta característica tem possibilitado garantir a qualidade do conjunto de dados, uma vez que todo material inserido passa pela revisão de pelo menos um moderador.

o potencial de a aplicação evoluir e tornar-se uma referência nacional e/ou, quiçá, internacional sobre a qual, vários grupos (alguns já demonstraram interesse) podem desenvolver suas atividades, gerando conhecimentos, como publicações, teses e dissertações entre outros trabalhos. Além disso, a infra-estrutura pode ser amplamente utilizada em pesquisas multiinstitucionais em IM e sinais, podendo vir a constituir uma base de dados multicêntrica e multidisciplinar.

Discussão e Conclusões

Referências

O arquivamento dos registros clínicos, em especial as IM, tem se mostrado algo de grande valia para o desenvolvimento de diferentes aplicações. Contudo, devido ao grande volume de dados e à riqueza de informações contidas nas IM, muitas dessas imagens não são propriamente analisadas ou correlacionadas com os sintomas e doenças. Muitas áreas esperam pela existência de repositórios públicos de IM para uso em tarefas como avaliação de software e desenvolvimento de aplicações clínicas. Compartilhamos também a visão do amplo uso desta base e das aplicações deste projeto em diversas atividades como, por exemplo, ensino e pesquisa em Radiologia (arquivo didático e ferramentas de auxílio em educação continuada – como uma nova forma de ensino de Radiologia) e o uso do conjunto de dados para testes e avaliação de métodos de processamento de IM (como por exemplo pesquisas em recuperação baseada em conteúdo – CBIR). Vale lembrar que em todo o esforço de desenvolver uma arquitetura de base de IM, como a que foi desenvolvida neste projeto, está também o desejo de viabilizar a instalação desta e/ou sua reprodução em outros centros. O único requisito é a disponibilidade de computadores para instalar as aplicações. Uma forma inicial que encontramos de disponibilizar foi torná-la disponível no projeto de tecnologias avançadas 11 de Internet (TIDIA-Kyatera ), onde os diversos grupos podem ser um site de armazenamento e compartilhar seus conjuntos de dados num ambiente de Internet de alta velocidade. Do ponto de vista de evolução do projeto, como mencionado, a arquitetura é distribuída e baseada em componentes. Com isso, observa-se

1. Cho, Z.H., Jones, J.P. (1993), Foundations of Medical Imaging. New York: John Wiley and Sons, 586p. 2. Tagare, H.D, Jaffe, C.C., Duncan, J., “Medical image databases: a content-based approach”, Journal of the American Medical Informatics Association; 3(4): 184-198, 1997. 3. Santos, M., Furuie, S.S., “Medical Image Database for Software and Algorithm Evaluation”, Proceedings of SPIE Medical Imaging 2005, v. 5748, p. 267-275. 4. Vannier, M.W., Staab, E.V., Clarke, L.C. Medical image archives – present and future. In Computer Assisted Radiology and Surgery. Paris, France: Spring Verlag, 2002. P.565567. 5. Clunie, D. A., DICOM Structured Reporting. [http://www.pixelmed.com/srbook.html] Acesso em 10 jul 2005. 6. Santos, M., Furuie, S.S. High performance web viewer for cardiac images. In Medical Imaging 2005: PACS and Imaging Informatics, 2004, San Diego – CA, USA. Proceedings of SPIE, 2004. v. 5371. p. 391-401.

11

Agradecimentos À Fundação Zerbini, Escola Politécnica da USP (EP-USP) à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) – processos n° 00056-1/2002, 01/14040-7 e 03/08133-8.

Contato Marcelo dos Santos, MSc Aluno de doutorado [email protected] Unidade de Pesquisa e Desenvolvimento Serviço de Informática – InCor-HCFMUSP Av Dr Enéas de Carvalho Aguiar, 44 CEP 05403-000 – São Paulo-SP Fone: +55 11 3069-5548 Fax: +55 11 3069-5311

http://www.kyatera.fapesp.br/portal

626

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.