PROJETOS QREN: QSEARCH
DESCRIÇÃO GERAL E OBJETIVOS
O QSearch é um projeto coordenado pela Quidgest em parceria com a entidade do SCT FCT/UNL que permite melhorar o acesso e gestão de
documentos através do desenvolvimento de três tecnologias fundamentais:
- Técnicas de análise de documentos textuais para extracção de informação;
- Técnicas avançadas de pesquisa;
- Interfaces de utilizador orientadas à navegação multifacetada.
Estas tecnologias representam atualmente as funcionalidades que os utilizadores de sistemas de gestão documental necessitam para aumentar a sua produtividade. Estas necessidades enquadram-se na estratégia de optimização do acesso aos arquivos de informação, seguida por muitas empresas e em aplicações de e-government a nível internacional. O desenvolvimento destas tecnologias tem também a preocupação de uma abordagem multilíngue e as necessidades de confidencialidade no acesso aos dados.
Promovido pela Quidgest, em colaboração com a Faculdade de Ciências e Tecnologia da Universidade Nova de Lisboa, o QSearch é um projeto financiado pelo QREN.
RESULTADOS
1.º Semestre
- Foram estudadas as diferentes soluções existentes;
- As especificações foram concluídas;
- Foram concebidos os crawlers de indexação sobre os dados disponíveis;
- Foram concebidas técnicas e ordenação de procuras;
- Foram concebidas técnicas de análise e expansão de procuras.
2.º Semestre
- Promoção dos resultados intermédios do QSearch no Codebits;
- Instalação do servidor de pesquisa de suporte ao projeto;
- Desenvolvimento de um protótipo inicial de interface de pesquisa;
- Análise de técnicas de determinação de duplicados e ficheiros similares;
- Aplicação das técnicas de indexação;
- Aplicação das técnicas de expansão de pesquisa;
- Análise de dados de documentos internos da empresa.
3.º Semestre
- Benchmark de várias técnicas de classificação adaptativa;
- Desenvolvimento de um sistema de seeding da classificação adaptativa;
- Desenvolvimento de técnicas de filtragem de ficheiros duplicados e similares;
- Benchmark de várias adaptações a algoritmos de ordenação;
- Desenvolvimento de algoritmos de aprendizagem da ordenação;
- Desenvolvimento de interfaces de expansão de termos de querys.
4.º Semestre
- Desenvolvimento de técnicas de aumento da diversidade de resultados de pesquisa;
- Prototipagem de filtros de confidencialidade de informação;
- Protótipo de interface de pesquisa com recolha de feedback do utilizador;
- Migração e benchmark da implementação da classificação adaptativa para a biblioteca Vowpal Wabbit
5.º Semestre
- Promoção dos resultados no Seminário Tecnológico da Quidgest no IST;
- Adaptação das interfaces de pesquisa de forma a suportar os padrões do Genio;
- Suporte dos algoritmos para a conexão e indexação de texto em bases de dados
6.º Semestre;
- Generalização dos componentes de conexão e de definição de pesquisas;
- Implementação do modelo definido para pesquisas no Genio;
- Integração dos algoritmos e interfaces na plataforma Genio;
- Implementação de políticas de segurança;
- Testes de algoritmos, benchmarking, interface e segurança