Objetivo
Esta seção descreve o processo de instalação das ferramentas necessárias à execução do processo de data mining para o “Resumo Geral de Abates” dentro da seção “Pacto Sinal Verde da Qualidade da Carne Bovina” do site CICarne.
Ambiente virtual do CICarne
Para facilitar o trabalho, criamos uma máquina virtual ubuntu, com o ambiente de desenvolvimento todo preparado com todas as ferramentas necessárias para rodar o data mining do CICarne. Para rodar esse ambiente, clone o repositório mining, que contém o vagranfile, o plugin e o ETL. Com o Vagrantfile em seu computador, através do cmd acesse a pasta onde está o vagrantfile, você pode usar os seguintes comandos no cmd:
- vagrant up = (comando que inicializa o processo de rodar a máquina virtual)
- vagrant halt = (comando para desligar a máquina virtual)
- vagrant destroy = (comando que destrói definitivamente a máquina virtual).
A máquina virtual possui um login: vagrant e senha: vagrant já configuradas por padrão.
Esse processo de subir e rodar a máquina virtual pode demorar alguns minutos, após o ambinte subir, você pode começar a trabalhar com o CICarne. Abaixo você encontra um tutorial de download e instalação de cada ferramenta usada no CICarne.
O Pentaho
O Pentaho é uma suíte que reúne ferramentas para o processo de ETL (Extract , Transform , Load, i.e., Extração, Transformação e Carregamento), criação de data warehouses e dashboards.
O Pentaho Business Analytics Platform, Community Edition
O Pentaho Business Analytics Platform é o módulo principal do Pentaho, sendo a base para o processo de data mining do CICarne.
Instalar o Pentaho Business Analytics Platform, Community Edition
-
Crie uma pasta no disco C do computador com o nome de opt. Todos os outros plugins ou softwares do Pentaho, serão colocados nessa mesma pasta opt.
-
Acesse SourceForge.
-
Na caixa de pesquisa, procure por Pentaho. A busca retornará Hitachi Vantara Pentaho, clique neste link. Quando abrir a página do Pentaho, Procure a aba Files. Em Files, clique em Business Intelligence Server. Vamos trabalhar com a versão 7.0, portanto, selecione a pasta 7.0. Note que terá alguns arquivos na pasta 7.0, selecione o que possui mais Downloads/Week, basta clicar que o download iniciará automaticamente.
-
Após o download, para realizar a instalação, basta extrair o arquivo que foi baixado, para a pasta opt que criamos no passo 1.
Pentaho Data Integration, Community Edition
O Pentaho Data Integration, também conhecido como Kettle, oferece poderosos recursos de extração, transformação e carregamento (Extract, Transform and Load - ETL).
Instalar o Pentaho Data Integration, Community Edition
-
Acesse SourceForge.
-
Na caixa de pesquisa, procure por Pentaho. A busca retornará Hitachi Vantara Pentaho, clique neste link. Quando abrir a página do Pentaho, Procure a aba Files. Em Files, clique em Data Integration. Vamos trabalhar com a versão 7.0, portanto, selecione a pasta 7.0. Note que terá alguns arquivos na pasta 7.0, selecione o que possui mais Downloads/Week, basta clicar que o download iniciará automaticamente.
-
Após o download, para realizar a instalação, basta extrair o arquivo que foi baixado, para a pasta opt que criamos.
Pentaho Schema Workbench, Community Edition
O Pentaho Schema Workbench também conhecido como Mondrian, é uma interface de design visual que permite criar e testar esquemas de cubo OLAP (Online Analytical Processing).
Instalar o Pentaho Schema Workbench, Community Edition
-
Acesse SourceForge.
-
Na caixa de pesquisa, procure por Mondrian. A busca retornará Mondrian, clique neste link. Quando abrir a página do Mondrian, Procure a aba Files. Em Files, clique em schema workbench. Como instalamos a versão 7.0 do Pentaho Server, vamos fazer o download de uma versão compatível, portanto clique na pasta 3.14.0. Note que terá apenas um arquivo, selecione o arquivo, o download iniciará automaticamente.
-
Após o download, para realizar a instalação, basta extrair o arquivo que foi baixado, para a pasta opt que criamos.
CTools
Ctools é um conjunto de ferramentas mantidos por uma comunidade de desenvolvedores que são instaladas como uma pilha no topo do servidor Pentaho Business Analytics e são comumente chamadas de “CTools”.
Community Dashboard Framework (CDF)
O Community Dashboard Framework permite que os desenvolvedores de Business Intelligence (BI) criem painéis de forma dinâmica e fácil que permitem aos usuários explorar e entender grandes quantidades de dados usando uma variedade de gráficos, tabelas e outros componentes e, em seguida, “detalhar” os dados exatos que desejam . Essa estrutura cria rapidamente painéis usando tecnologias da Web, como JavaScript, CSS e HTML, o que permite ao designer de painéis controlar todo o ciclo de vida do painel sem recorrer à codificação Java.
Instalar o Community Dashboard Framework
- Acesso localhost:8080/pentaho/home, selecione Marketplace, a página carregará um campo de busca, neste campo pesquise pelo nome da ferramenta e selecione ela.
- Selecione o botão de instalação, após isso é só aguarde a instalação ser concluída.
Community Dashboard Editor (CDE)
o Community Dashboard Editor é um editor de painel gráfico que fornece acesso aos componentes do painel no CDF. Essa ferramenta usa uma grade para o layout que permite que os usuários criem seus próprios painéis sem precisar de muita experiência em JavaScript ou HTML. O CDE visa simplificar a criação e a adição de painéis do CTools.
Instalar o Community Dashboard Editor
- Acesso localhost:8080/pentaho/home, selecione Marketplace, a página carregará um campo de busca, neste campo pesquise pelo nome da ferramenta e selecione ela.
- Selecione o botão de instalação, após isso é só aguarde a instalação ser concluída.
Community Data Access (CDA)
O Community Data Access permite reunir e combinar dados de várias fontes de dados em uma única estrutura, que você pode usar em painéis. Impulsionado pela necessidade de unificar o acesso à camada de dados Pentaho, o CDA foi desenvolvido para criar uma camada de abstração entre um painel do CTools e as conexões físicas para diferentes bancos de dados.
Instalar o Community Data Access
- Acesso localhost:8080/pentaho/home, selecione Marketplace, a página carregará um campo de busca, neste campo pesquise pelo nome da ferramenta e selecione ela.
- Selecione o botão de instalação, após isso é só aguarde a instalação ser concluída.
PostgreSQL
O PostgreSQL É um poderoso sistema de banco de dados objeto-relacional de código aberto.
Instalar o PostgreSQL
- Acesse PostgreSQL, e baixe a última versão do PostgreSQL.
- Para instalar, basta executar o instalador de modo default.