Looking for Course 631 test answers and solutions? Browse our comprehensive collection of verified answers for Course 631 at online.iscap.ipp.pt.
Get instant access to accurate answers and detailed explanations for your course questions. Our community-driven platform helps students succeed!
O desequilíbrio entre classes numa classificação binária pode ser encontrado em muitos problemas de classificação reais. A técnica de undersampling consiste no balanceamento através da redução das amostras da classe maioritária.
A seleção de atributos (Feature Selection) tem por objectivo identificar o conjunto de termos/palavras mais relevantes que representa o conjunto de documentos para melhorar a eficiência do processo de classificação e reduzir a complexidade computacional.
Na Aprendizagem Supervisionada é necessário um conjunto de dados de treino e um conjunto de dados de teste, sendo os dados de teste usados para treinar o classificador e os dados de treino para teste.
A ideia principal de TF‑IDF é:
Na classificação os documentos de texto têm de ser convertidos para um formato que permita o seu processamento computacional. Uma abordagem é a representação vectorial onde cada elemento representa uma palavra ou termo e possui um valor numérico associado. Este valor representa a importância da palavra ou termo no conjunto dos documentos.
A selecção de atributos procura encontrar um subconjunto de atributos que melhor representa o texto em termos de relevância, melhorando a precisão dos modelos de aprendizagem.
O que é uma STOP WORD?
O Stemming (radicalização) corresponde ao processo de remover as terminações morfológicas e verbais mais comuns das palavras para se encontrar o stem (o radical) da palavra.
Indique se a seguinte afirmação é falsa ou verdadeira:
Aplicando Stemming, a um documento ou conjunto de documentos, pode haver perda de informação pois duas palavras diferentes podem ter o mesmo radical.
A remoção de palavras como "the", "of", "is", "it", "an", de um texto/documento é apelidada de
Considerando o pipeline completo de Text Mining, para análise de sentimentos de um conjunto de reviews, enquadre de forma correcta as técnicas de pre-processamento, os classificadores e as medidas de desempenho, nas diferentes fases do pipeline geral de Text Mining: