Seminário 1: modelos de recuperação da informação
Postagem realizada em: 09/05/2022 às 21:47:27
Autor: Thayna Carvalho Gomes
O primeiro seminário foi apresentado pelas estudantes Ignez Denise Gomes Moura e Larissa Vitoria Mendes Proença, com o tema de “Bases de dados referenciais, catalográficas, bibliográficas e de textos completos”, a apresentação foi bastante enriquecedora e formou uma base de informações para os seminários posteriores, a dupla passou por conceitos históricos, definições conceituais e de critérios avaliativos, diferenciações e exemplos. Além disso, o grupo também preocupou-se em referenciar como exemplo tópicos conhecidos pelos estudantes ouvintes do seminário, como as bases mencionadas e também os filmes que foram citados, auxiliando em uma melhor compreensão da temática exposta.
A parte sobre recuperação da informação rendeu uma extensa e complexa exposição tanto das estudantes que estavam apresentando, quanto da professora Brasilina. A dupla passou por alguns alguns modelos de recuperação, como o operador booleano, que já tinhamos visto em uma palestra com a bibliotecária Marina Macambyra. O operador booleano utilizam palavras que informam o sistema de busca como combinar os termos de uma pesquisa, é utilizado o “AND”, que em tradução livre seria “E”, para interceção dos termos. Ainda é utilizado o “OR”, que em tradução livre seria “OU”, para indicar a união dos conjuntos. Inclusive a professora Brasilina associou essas definições com a teoria matemática dos conjuntos, o que ilustrou bem o conceito.
O outro modelo citado é o vetorial, que considera o sistema de uso de sistemas binários, como o operador booleano, um pouco limitado, então propõe o uso de pesos não binários para representar documentos em consultas como vetores de termo, sendo assim, o modelo vetorial traz documentos que combinam ou condizem com a temática da consulta de forma parcial, de forma que seja mais preciso do que o operador booleano. Para isso, o modelo vetorial necessita de um cálculo que balancea a importância intra-documentos dos termos.
Também é citado o modelo probabilístico, que usa a teoria matemática da probabilidade para recuperar uma informação, é calculado a probabilidade de que um documento seja relevante e a probabilidade que um documento não seja relevante, depois ambos os cálculos probabilísticos são comparados. Esse tipo de recuperação da informação é utilizado também nos algoritmos de pontuação probabilística.
Ainda há mais um modelo de recuperação da informação que não foi mencionado durante o seminário, porém foi pontuado pela professora Brasilina, que é o algoritmo. Já mencionado em outras aulas de Recursos Informacionais II, o algoritmo de busca considera se uma informação ocorre com e com qual frequência acontece as ocorrências, de forma que consiga recuperar um documento dentro de uma coleção de documentos.
Referências Bibliográficas
Algoritmo de Busca. Panda ime, [S.l], [s.d]. Disponível em: https://panda.ime.usp.br/cc110/static/cc110/13-busca.html. Acesso em: 09 mai. 2022.
Algoritmo de busca. Wikipédia, [S.l], 2020. Disponível em: https://pt.wikipedia.org/wiki/Algoritmo_de_busca#:~:text=Em%20ci%C3%AAncia%20da%20computa%C3%A7%C3%A3o%2C%20um,um%20n%C3%BAmero%20poss%C3%ADvel%20de%20solu%C3%A7%C3%B5es. Acesso em: 09 mai. 2022.
Modelo probabilístico. Wikipedia, [S.l], 2017. Disponível em: https://pt.wikipedia.org/wiki/Modelo_probabil%C3%ADstico. Acesso em: 09 mai. 2022.
Modelo vetorial em sistema de recuperação da informação. Wikipédia, [S.l], 2020. Disponível em: https://pt.wikipedia.org/wiki/Modelo_vetorial_em_sistemas_de_recupera%C3%A7%C3%A3o_da_informa%C3%A7%C3%A3o. Acesso em: 09 mai. 2022.
MOURA, I. D. G.; PROENÇA, L. V. M. Bases de dados referenciais, catalográficas, bibliográficas e de textos completo. São Paulo: Recursos Informacionais II, apresentação em power point, 2022.