QSEARCH
First Sight Model

PROJETOS QREN: QSEARCH

DESCRIÇÃO GERAL E OBJETIVOS
O QSearch é um projeto coordenado pela Quidgest em parceria com a entidade do SCT FCT/UNL que permite melhorar o acesso e gestão de documentos através do desenvolvimento de três tecnologias fundamentais:

  1. Técnicas de análise de documentos textuais para extracção de informação;
  2. Técnicas avançadas de pesquisa;
  3. Interfaces de utilizador orientadas à navegação multifacetada.

Estas tecnologias representam atualmente as funcionalidades que os utilizadores de sistemas de gestão documental necessitam para aumentar a sua produtividade. Estas necessidades enquadram-se na estratégia de optimização do acesso aos arquivos de informação, seguida por muitas empresas e em aplicações de e-government a nível internacional. O desenvolvimento destas tecnologias tem também a preocupação de uma abordagem multilíngue e as necessidades de confidencialidade no acesso aos dados.

Promovido pela Quidgest, em colaboração com a Faculdade de Ciências e Tecnologia da Universidade Nova de Lisboa, o QSearch é um projeto financiado pelo QREN.

RESULTADOS

1.º Semestre
  • Foram estudadas as diferentes soluções existentes;
  • As especificações foram concluídas;
  • Foram concebidos os crawlers de indexação sobre os dados disponíveis;
  • Foram concebidas técnicas e ordenação de procuras;
  • Foram concebidas técnicas de análise e expansão de procuras.

2.º Semestre
  • Promoção dos resultados intermédios do QSearch no Codebits;
  • Instalação do servidor de pesquisa de suporte ao projeto;
  • Desenvolvimento de um protótipo inicial de interface de pesquisa;
  • Análise de técnicas de determinação de duplicados e ficheiros similares;
  • Aplicação das técnicas de indexação;
  • Aplicação das técnicas de expansão de pesquisa;
  • Análise de dados de documentos internos da empresa.

3.º Semestre
  • Benchmark de várias técnicas de classificação adaptativa;
  • Desenvolvimento de um sistema de seeding da classificação adaptativa;
  • Desenvolvimento de técnicas de filtragem de ficheiros duplicados e similares;
  • Benchmark de várias adaptações a algoritmos de ordenação;
  • Desenvolvimento de algoritmos de aprendizagem da ordenação;
  • Desenvolvimento de interfaces de expansão de termos de querys.

4.º Semestre
  • Desenvolvimento de técnicas de aumento da diversidade de resultados de pesquisa;
  • Prototipagem de filtros de confidencialidade de informação;
  • Protótipo de interface de pesquisa com recolha de feedback do utilizador;
  • Migração e benchmark da implementação da classificação adaptativa para a biblioteca Vowpal Wabbit

5.º Semestre
  • Promoção dos resultados no Seminário Tecnológico da Quidgest no IST;
  • Adaptação das interfaces de pesquisa de forma a suportar os padrões do Genio;
  • Suporte dos algoritmos para a conexão e indexação de texto em bases de dados

6.º Semestre;
  • Generalização dos componentes de conexão e de definição de pesquisas;
  • Implementação do modelo definido para pesquisas no Genio;
  • Integração dos algoritmos e interfaces na plataforma Genio;
  • Implementação de políticas de segurança;
  • Testes de algoritmos, benchmarking, interface e segurança

UM PROJETO:
quidgest, fct
COM O APOIO:
POR lISBOA, QREN, união Europeia