Crowdly

Add to Chrome

Universities
online.iscap.ipp.pt
Course 631

Course 631

Looking for Course 631 test answers and solutions? Browse our comprehensive collection of verified answers for Course 631 at online.iscap.ipp.pt.

Get instant access to accurate answers and detailed explanations for your course questions. Our community-driven platform helps students succeed!

O desequilíbrio entre classes numa classificação binária pode ser encontrado em muitos problemas de classificação reais. A técnica de undersampling consiste no balanceamento através da redução das amostras da classe maioritária.

Falso

Não respondo

Verdadeiro

100%

View this question

A seleção de atributos (Feature Selection) tem por objectivo identificar o conjunto de termos/palavras mais relevantes que representa o conjunto de documentos para melhorar a eficiência do processo de classificação e reduzir a complexidade computacional.

Falso

100%

Não respondo

Verdadeiro

View this question

Na Aprendizagem Supervisionada é necessário um conjunto de dados de treino e um conjunto de dados de teste, sendo os dados de teste usados para treinar o classificador e os dados de treino para teste.

Falso

100%

Não respondo

Verdadeiro

View this question

A ideia principal de TF‑IDF é:

Usar apenas termos raros

Codificar a posição da palavra na frase

Reforçar palavras muito frequentes em todos os documentos

Atribuir mais peso a termos frequentes num documento mas raros na coleção

100%

Não respondo

View this question

Na classificação os documentos de texto têm de ser convertidos para um formato que permita o seu processamento computacional. Uma abordagem é a representação vectorial onde cada elemento representa uma palavra ou termo e possui um valor numérico associado. Este valor representa a importância da palavra ou termo no conjunto dos documentos.

Falso

Não respondo

Verdadeiro

100%

View this question

A selecção de atributos procura encontrar um subconjunto de atributos que melhor representa o texto em termos de relevância, melhorando a precisão dos modelos de aprendizagem.

Falso

Não respondo

Verdadeiro

100%

View this question

O que é uma STOP WORD?

É um conjunto de dados não estruturados

É um vector

Não respondo

É uma palavra que contém pouco ou nenhum significado

100%

View this question

O Stemming (radicalização) corresponde ao processo de remover as terminações morfológicas e verbais mais comuns das palavras para se encontrar o stem (o radical) da palavra.

Indique se a seguinte afirmação é falsa ou verdadeira:

Aplicando Stemming, a um documento ou conjunto de documentos, pode haver perda de informação pois duas palavras diferentes podem ter o mesmo radical.

Falsa

Não respondo

Verdadeira

100%

View this question

A remoção de palavras como "the", "of", "is", "it", "an", de um texto/documento é apelidada de

Lematization

Não respondo

Remoção de SopWords

100%

Stemming

Tokenization

View this question

Considerando o pipeline completo de Text Mining, para análise de sentimentos de um conjunto de reviews, enquadre de forma correcta as técnicas de pre-processamento, os classificadores e as medidas de desempenho, nas diferentes fases do pipeline geral de Text Mining:

Removing Stopwords

Support Vector Machines (SVM)

K- Nearest Neighbor (K-NN)

Kappa Statistics

F1-Measure

Accuracy

Bag of Words (BOW)

Lemmatization

Conversão para minúsculas

View this question