Шукаєте відповіді та рішення тестів для Course 631? Перегляньте нашу велику колекцію перевірених відповідей для Course 631 в online.iscap.ipp.pt.
Отримайте миттєвий доступ до точних відповідей та детальних пояснень для питань вашого курсу. Наша платформа, створена спільнотою, допомагає студентам досягати успіху!
O desequilíbrio entre classes numa classificação binária pode ser encontrado em muitos problemas de classificação reais. A técnica de undersampling consiste no balanceamento através da redução das amostras da classe maioritária.
A seleção de atributos (Feature Selection) tem por objectivo identificar o conjunto de termos/palavras mais relevantes que representa o conjunto de documentos para melhorar a eficiência do processo de classificação e reduzir a complexidade computacional.
Na Aprendizagem Supervisionada é necessário um conjunto de dados de treino e um conjunto de dados de teste, sendo os dados de teste usados para treinar o classificador e os dados de treino para teste.
A ideia principal de TF‑IDF é:
Na classificação os documentos de texto têm de ser convertidos para um formato que permita o seu processamento computacional. Uma abordagem é a representação vectorial onde cada elemento representa uma palavra ou termo e possui um valor numérico associado. Este valor representa a importância da palavra ou termo no conjunto dos documentos.
A selecção de atributos procura encontrar um subconjunto de atributos que melhor representa o texto em termos de relevância, melhorando a precisão dos modelos de aprendizagem.
O que é uma STOP WORD?
O Stemming (radicalização) corresponde ao processo de remover as terminações morfológicas e verbais mais comuns das palavras para se encontrar o stem (o radical) da palavra.
Indique se a seguinte afirmação é falsa ou verdadeira:
Aplicando Stemming, a um documento ou conjunto de documentos, pode haver perda de informação pois duas palavras diferentes podem ter o mesmo radical.
A remoção de palavras como "the", "of", "is", "it", "an", de um texto/documento é apelidada de
Considerando o pipeline completo de Text Mining, para análise de sentimentos de um conjunto de reviews, enquadre de forma correcta as técnicas de pre-processamento, os classificadores e as medidas de desempenho, nas diferentes fases do pipeline geral de Text Mining: