No dia 11 de março de 2024, será realizado um curso gratuito sobre uma nova metodologia para classificar texto em dados não rotulados utilizando Large Language Models (LLM), o curso será ministrado pelo Prof. Ricardo M. Marcacini para os membros dos grupos LACA e LABIC.
Título: UTME for Customer Complaints Analysis (Projeto PRONEM)
A classificação de documentos dentro de uma taxonomia é um desafio predominante para organizações que lidam com dados textuais, especialmente para organizar, quantificar e analisar reclamações de consumidores em diferentes setores. As abordagens tradicionais baseiam-se em técnicas supervisionadas, eficazes em conjuntos de dados específicos, mas limitadas pela necessidade de extensas bases de documentos anotados. Neste minicurso é apresentada uma nova metodologia para classificar texto dentro de uma taxonomia na ausência de dados rotulados, de maneira similar a um processo de modelagem de tópicos. A metodologia é baseada nas recentes Large Language Models (LLM) abertas, que exigem menos recursos computacionais, e que demonstraram desempenho competitivo para dados de reclamações de consumidores de diferentes domínios e escritos na língua portuguesa.
Ministrante: Ricardo Marcacini obteve seu doutorado em Ciência da Computação e Matemática Computacional pelo ICMC-USP em 2014. Atualmente, é docente do Departamento de Ciência da Computação do ICMC-USP e atua na ampla área de Inteligência Artificial, com ênfase em técnicas de agrupamento de dados e aprendizado de máquina em múltiplas modalidades, incluindo texto, imagem e áudio. Suas áreas de interesse abrangem análise de sentimentos e análise de eventos.