Titanic Dataset

Analisar o Titanic foi só o pretexto. O verdadeiro objetivo era mostrar que até os dados mais simples podem dar trabalho quando abrimos mão das ferramentas certas. Claro que é possível fazer tudo na unha, mas por que reinventar o leme se já temos navios modernos? Com Pandas, o processo se torna mais limpo, rápido e elegante. Mas entender o que está por trás das abstrações é o que separa quem só copia código de quem realmente sabe o que está fazendo. Titanic Dataset

Analisar o Titanic foi só o pretexto. O verdadeiro objetivo era mostrar que até os dados mais simples podem dar trabalho quando abrimos mão das ferramentas certas. Claro que é possível fazer tudo na unha, mas por que reinventar o leme se já temos navios modernos? Com Pandas, o processo se torna mais limpo, rápido e elegante. Mas entender o que está por trás das abstrações é o que separa quem só copia código de quem realmente sabe o que está fazendo. Titanic Dataset

Top 25 Ferramentas do Hadoop

O Hadoop é o pai do bigdata. Ele possui um ecossistema próprio com diversas ferramentas com propósitos diferentes. Aqui em Top 25 Ferramentas do Hadoop vamos dar uma visão geral sobre diversas dessas, tais como Hive, Pig, Sqoop, Kafka, Zookeeper. Note que nem todas essas ferramentas são dependentes do Hadoop, mas são relevantes para o ecossistema e por isso aparecem na lista.

O Hadoop é o pai do bigdata. Ele possui um ecossistema próprio com diversas ferramentas com propósitos diferentes. Aqui em Top 25 Ferramentas do Hadoop vamos dar uma visão geral sobre diversas dessas, tais como Hive, Pig, Sqoop, Kafka, Zookeeper. Note que nem todas essas ferramentas são dependentes do Hadoop, mas são relevantes para o ecossistema e por isso aparecem na lista.

O básico de Apache Airflow

O Apache Airflow é uma ferramenta notável por sua flexibilidade e por trabalhar diretamente com python, que facilita bastante. O orquestrador de workflows de dados trabalha com diversas dags para cumprir o seu propósito. O artigo oferece uma visão geral tanto do conceito quanto de uma criação real em python.

O Apache Airflow é uma ferramenta notável por sua flexibilidade e por trabalhar diretamente com python, que facilita bastante. O orquestrador de workflows de dados trabalha com diversas dags para cumprir o seu propósito. O artigo oferece uma visão geral tanto do conceito quanto de uma criação real em python.