Objetivo

Esta seção descreve o processo de instalação das ferramentas necessárias à execução do processo de data mining para o “Resumo Geral de Abates” dentro da seção “Pacto Sinal Verde da Qualidade da Carne Bovina” do site CICarne.

Ambiente virtual do CICarne

Para facilitar o trabalho, criamos uma máquina virtual ubuntu, com o ambiente de desenvolvimento todo preparado com todas as ferramentas necessárias para rodar o data mining do CICarne. Para rodar esse ambiente, clone o repositório mining, que contém o vagranfile, o plugin e o ETL. Com o Vagrantfile em seu computador, através do cmd acesse a pasta onde está o vagrantfile, você pode usar os seguintes comandos no cmd:

  • vagrant up = (comando que inicializa o processo de rodar a máquina virtual)
  • vagrant halt = (comando para desligar a máquina virtual)
  • vagrant destroy = (comando que destrói definitivamente a máquina virtual).

A máquina virtual possui um login: vagrant e senha: vagrant já configuradas por padrão.

Esse processo de subir e rodar a máquina virtual pode demorar alguns minutos, após o ambinte subir, você pode começar a trabalhar com o CICarne. Abaixo você encontra um tutorial de download e instalação de cada ferramenta usada no CICarne.

O Pentaho

O Pentaho é uma suíte que reúne ferramentas para o processo de ETL (Extract , Transform , Load, i.e., Extração, Transformação e Carregamento), criação de data warehouses e dashboards.

O Pentaho Business Analytics Platform, Community Edition

O Pentaho Business Analytics Platform é o módulo principal do Pentaho, sendo a base para o processo de data mining do CICarne.

Instalar o Pentaho Business Analytics Platform, Community Edition

  • Crie uma pasta no disco C do computador com o nome de opt. Todos os outros plugins ou softwares do Pentaho, serão colocados nessa mesma pasta opt.

  • Acesse SourceForge.

  • Na caixa de pesquisa, procure por Pentaho. A busca retornará Hitachi Vantara Pentaho, clique neste link. Quando abrir a página do Pentaho, Procure a aba Files. Em Files, clique em Business Intelligence Server. Vamos trabalhar com a versão 7.0, portanto, selecione a pasta 7.0. Note que terá alguns arquivos na pasta 7.0, selecione o que possui mais Downloads/Week, basta clicar que o download iniciará automaticamente.

  • Após o download, para realizar a instalação, basta extrair o arquivo que foi baixado, para a pasta opt que criamos no passo 1.

Pentaho Data Integration, Community Edition

O Pentaho Data Integration, também conhecido como Kettle, oferece poderosos recursos de extração, transformação e carregamento (Extract, Transform and Load - ETL).

Instalar o Pentaho Data Integration, Community Edition

  • Acesse SourceForge.

  • Na caixa de pesquisa, procure por Pentaho. A busca retornará Hitachi Vantara Pentaho, clique neste link. Quando abrir a página do Pentaho, Procure a aba Files. Em Files, clique em Data Integration. Vamos trabalhar com a versão 7.0, portanto, selecione a pasta 7.0. Note que terá alguns arquivos na pasta 7.0, selecione o que possui mais Downloads/Week, basta clicar que o download iniciará automaticamente.

  • Após o download, para realizar a instalação, basta extrair o arquivo que foi baixado, para a pasta opt que criamos.

Pentaho Schema Workbench, Community Edition

O Pentaho Schema Workbench também conhecido como Mondrian, é uma interface de design visual que permite criar e testar esquemas de cubo OLAP (Online Analytical Processing).

Instalar o Pentaho Schema Workbench, Community Edition

  • Acesse SourceForge.

  • Na caixa de pesquisa, procure por Mondrian. A busca retornará Mondrian, clique neste link. Quando abrir a página do Mondrian, Procure a aba Files. Em Files, clique em schema workbench. Como instalamos a versão 7.0 do Pentaho Server, vamos fazer o download de uma versão compatível, portanto clique na pasta 3.14.0. Note que terá apenas um arquivo, selecione o arquivo, o download iniciará automaticamente.

  • Após o download, para realizar a instalação, basta extrair o arquivo que foi baixado, para a pasta opt que criamos.

CTools

Ctools é um conjunto de ferramentas mantidos por uma comunidade de desenvolvedores que são instaladas como uma pilha no topo do servidor Pentaho Business Analytics e são comumente chamadas de “CTools”.

Community Dashboard Framework (CDF)

O Community Dashboard Framework permite que os desenvolvedores de Business Intelligence (BI) criem painéis de forma dinâmica e fácil que permitem aos usuários explorar e entender grandes quantidades de dados usando uma variedade de gráficos, tabelas e outros componentes e, em seguida, “detalhar” os dados exatos que desejam . Essa estrutura cria rapidamente painéis usando tecnologias da Web, como JavaScript, CSS e HTML, o que permite ao designer de painéis controlar todo o ciclo de vida do painel sem recorrer à codificação Java.

Instalar o Community Dashboard Framework

  • Acesso localhost:8080/pentaho/home, selecione Marketplace, a página carregará um campo de busca, neste campo pesquise pelo nome da ferramenta e selecione ela.
  • Selecione o botão de instalação, após isso é só aguarde a instalação ser concluída.

Community Dashboard Editor (CDE)

o Community Dashboard Editor é um editor de painel gráfico que fornece acesso aos componentes do painel no CDF. Essa ferramenta usa uma grade para o layout que permite que os usuários criem seus próprios painéis sem precisar de muita experiência em JavaScript ou HTML. O CDE visa simplificar a criação e a adição de painéis do CTools.

Instalar o Community Dashboard Editor

  • Acesso localhost:8080/pentaho/home, selecione Marketplace, a página carregará um campo de busca, neste campo pesquise pelo nome da ferramenta e selecione ela.
  • Selecione o botão de instalação, após isso é só aguarde a instalação ser concluída.

Community Data Access (CDA)

O Community Data Access permite reunir e combinar dados de várias fontes de dados em uma única estrutura, que você pode usar em painéis. Impulsionado pela necessidade de unificar o acesso à camada de dados Pentaho, o CDA foi desenvolvido para criar uma camada de abstração entre um painel do CTools e as conexões físicas para diferentes bancos de dados.

Instalar o Community Data Access

  • Acesso localhost:8080/pentaho/home, selecione Marketplace, a página carregará um campo de busca, neste campo pesquise pelo nome da ferramenta e selecione ela.
  • Selecione o botão de instalação, após isso é só aguarde a instalação ser concluída.

PostgreSQL

O PostgreSQL É um poderoso sistema de banco de dados objeto-relacional de código aberto.

Instalar o PostgreSQL

  1. Acesse PostgreSQL, e baixe a última versão do PostgreSQL.
  2. Para instalar, basta executar o instalador de modo default.