Crowdly

Додати до Chrome

Університети
online.iscap.ipp.pt
Course 631

Course 631

Шукаєте відповіді та рішення тестів для Course 631? Перегляньте нашу велику колекцію перевірених відповідей для Course 631 в online.iscap.ipp.pt.

Отримайте миттєвий доступ до точних відповідей та детальних пояснень для питань вашого курсу. Наша платформа, створена спільнотою, допомагає студентам досягати успіху!

O desequilíbrio entre classes numa classificação binária pode ser encontrado em muitos problemas de classificação reais. A técnica de undersampling consiste no balanceamento através da redução das amostras da classe maioritária.

Falso

Não respondo

Verdadeiro

100%

Переглянути це питання

A seleção de atributos (Feature Selection) tem por objectivo identificar o conjunto de termos/palavras mais relevantes que representa o conjunto de documentos para melhorar a eficiência do processo de classificação e reduzir a complexidade computacional.

Falso

100%

Não respondo

Verdadeiro

Переглянути це питання

Na Aprendizagem Supervisionada é necessário um conjunto de dados de treino e um conjunto de dados de teste, sendo os dados de teste usados para treinar o classificador e os dados de treino para teste.

Falso

100%

Não respondo

Verdadeiro

Переглянути це питання

A ideia principal de TF‑IDF é:

Usar apenas termos raros

Codificar a posição da palavra na frase

Reforçar palavras muito frequentes em todos os documentos

Atribuir mais peso a termos frequentes num documento mas raros na coleção

100%

Não respondo

Переглянути це питання

Na classificação os documentos de texto têm de ser convertidos para um formato que permita o seu processamento computacional. Uma abordagem é a representação vectorial onde cada elemento representa uma palavra ou termo e possui um valor numérico associado. Este valor representa a importância da palavra ou termo no conjunto dos documentos.

Falso

Não respondo

Verdadeiro

100%

Переглянути це питання

A selecção de atributos procura encontrar um subconjunto de atributos que melhor representa o texto em termos de relevância, melhorando a precisão dos modelos de aprendizagem.

Falso

Não respondo

Verdadeiro

100%

Переглянути це питання

O que é uma STOP WORD?

É um conjunto de dados não estruturados

É um vector

Não respondo

É uma palavra que contém pouco ou nenhum significado

100%

Переглянути це питання

O Stemming (radicalização) corresponde ao processo de remover as terminações morfológicas e verbais mais comuns das palavras para se encontrar o stem (o radical) da palavra.

Indique se a seguinte afirmação é falsa ou verdadeira:

Aplicando Stemming, a um documento ou conjunto de documentos, pode haver perda de informação pois duas palavras diferentes podem ter o mesmo radical.

Falsa

Não respondo

Verdadeira

100%

Переглянути це питання

A remoção de palavras como "the", "of", "is", "it", "an", de um texto/documento é apelidada de

Lematization

Não respondo

Remoção de SopWords

100%

Stemming

Tokenization

Переглянути це питання

Considerando o pipeline completo de Text Mining, para análise de sentimentos de um conjunto de reviews, enquadre de forma correcta as técnicas de pre-processamento, os classificadores e as medidas de desempenho, nas diferentes fases do pipeline geral de Text Mining:

Removing Stopwords

Support Vector Machines (SVM)

K- Nearest Neighbor (K-NN)

Kappa Statistics

F1-Measure

Accuracy

Bag of Words (BOW)

Lemmatization

Conversão para minúsculas

Переглянути це питання