O procedimento geral adotado para os métodos não hierárquicos é:
Como funciona?
A clusterização, baseada no cálculo da distância entre os objetos do conjunto de dados, é conhecida como conectividade, ou hierárquica. Dependendo na 'direção' do algoritmo, o mesmo pode juntar ou, pelo contrário, dividir o conjunto de informação – os nomes aglomerativo ou divisivo tem essa origem.
Cluster (ou clustering) é, em poucas palavras, o nome dado a um sistema que relaciona dois ou mais computadores para que estes trabalhem de maneira conjunta no intuito de processar uma tarefa. Estas máquinas dividem entre si as atividades de processamento e executam este trabalho de maneira simultânea.
O K-means é um algoritmo do tipo não supervisionado, ou seja, que não trabalha com dados rotulados. O objetivo desse algoritmo é encontrar similaridades entre os dados e agrupá-los conforme o número de cluster passado pelo argumento k.