Grep.Comp - Grupo de Estudo e Pesquisa em Computação Aplicada

LABIC oferece curso sobre nova metodologia para classificar texto em dados não rotulados

No dia 11 de março de 2024, será realizado um curso gratuito sobre uma nova metodologia para classificar texto em dados não rotulados utilizando Large Language Models (LLM), o curso será ministrado pelo Prof. Ricardo M. Marcacini para os membros dos grupos LACA e LABIC.

Título: UTME for Customer Complaints Analysis (Projeto PRONEM)

A classificação de documentos dentro de uma taxonomia é um desafio predominante para organizações que lidam com dados textuais, especialmente para organizar, quantificar e analisar reclamações de consumidores em diferentes setores. As abordagens tradicionais baseiam-se em técnicas supervisionadas, eficazes em conjuntos de dados específicos, mas limitadas pela necessidade de extensas bases de documentos anotados. Neste minicurso é apresentada uma nova metodologia para classificar texto dentro de uma taxonomia na ausência de dados rotulados, de maneira similar a um processo de modelagem de tópicos. A metodologia é baseada nas recentes Large Language Models (LLM) abertas, que exigem menos recursos computacionais, e que demonstraram desempenho competitivo para dados de reclamações de consumidores de diferentes domínios e escritos na língua portuguesa.

Ministrante: Ricardo Marcacini obteve seu doutorado em Ciência da Computação e Matemática Computacional pelo ICMC-USP em 2014. Atualmente, é docente do Departamento de Ciência da Computação do ICMC-USP e atua na ampla área de Inteligência Artificial, com ênfase em técnicas de agrupamento de dados e aprendizado de máquina em múltiplas modalidades, incluindo texto, imagem e áudio. Suas áreas de interesse abrangem análise de sentimentos e análise de eventos.