Deve preocupar-se menos com a inteligência artificial geral e mais com a forma como os dados o podem ajudar a tomar melhores decisões.

As narrativas populares sobre o futuro da transformação digital centram-se geralmente em robôs autónomos, inteligência artificial a nível humano e aprendizagem de máquinas.

No entanto, antes de tirar conclusões precipitadas sobre como estes desenvolvimentos excitantes podem enquadrar-se no seu futuro local de trabalho, é importante compreender o que os torna possíveis: dados e a utilização dos mesmos, de uma forma que possa realizar o seu potencial.

ciencia dos dados

O termo «ciência dos dados» nas palavras dos cientistas informáticos John D. Kelleher e Brendan Tierney abrange um «conjunto de princípios, definições de problemas, algoritmos e processos para extrair padrões não óbvios e úteis de grandes conjuntos de dados».

É a abordagem da ciência dos dados que nos oferece tantas possibilidades à nossa frente: 

  • recomendações de publicidade do Google;
  • software de reconhecimento facial. 

No entanto, antes de nos distrairmos facilmente com uma visão de robôs que aceitam todos os trabalhos, vamos primeiro concentrar-nos em como a ciência dos dados torna tal visão possível e quais são os pontos fortes, fraquezas e implicações da ciência dos dados.


Ciência dos dados: é um problema?

A ciência dos dados e o seu primo, a inteligência artificial, têm sido populares muitas vezes.

A onda de interesse que surgiu em meados dos anos 2000 foi precedida por um fascínio inicial nos anos 50, devido ao trabalho do matemático britânico pioneiro Alan Turing.

Turing concebeu o seu epónimo «Turing Test»: se uma máquina podia enganar um humano para pensar que era humano, então alcançaria inteligência a nível humano. (Poucas pessoas concordam ainda com esta conclusão, apesar da sua influência.) 

O entusiasmo transformou-se em desilusão, nos anos 70, quando a inteligência artificial não conseguiu cumprir as suas elevadas promessas. 

O interesse voltou a aumentar nos anos 80 com a emergência de sistemas de peritos baseados em regras – algoritmos de processamento de informação – a serem aplicadas extensivamente em ambientes comerciais. Isto provou mais uma vez um falso amanhecer, com as despesas governamentais de investigação e desenvolvimento sobre IA e ciência de dados a diminuírem no final da década.


A onda de interesse na ciência dos dados

A onda de interesse na ciência dos dados continuou a ganhar ascendência nos anos 2010, emergindo por razões bastante distintivas em comparação com as ondas anteriores. 

Neste caso, o entusiasmo com a ciência dos dados tem sido impulsionada por quatro fatores inovadores. 

  • Primeiro, há mais dados do que alguma vez se verificou; com dispositivos de consumo, câmaras, telemóveis, sensores e mais, tudo isto produzindo constantemente dados. 
  • Segundo, o custo do armazenamento de dados: tanto para o armazenamento em disco, que é ótimo para armazenar grandes volumes de dados, mas pobre para o acesso; como para o armazenamento de memória de acesso aleatório (RAM), que é melhor para o acesso aos dados. 
  • Terceiro, o custo do processamento informático (combinar, contar, comparar ou aplicar regras condicionais simples aos dados) é mais baixo do que nunca. 
  • E, em quarto lugar, o advento da CLOUD/nuvem permitiu que quase todas as organizações começassem a pensar nos dados nos «grandes dados» e aplicassem técnicas de ciência de dados.

A ciência de dados – mesmo com todas as reduções de custos que ocorreram – requer investimento e o retorno do investimento em certos setores permanece ambíguo. 

Para ter qualquer esperança de sucesso, é necessário ter primeiro uma noção realmente clara da razão pela qual se quer envolver em técnicas de ciência de dados. 


A ciência dos dados: a abordagem operacional

O processo padrão passa por mineração de dados e «compreensão do negócio». 

Os cientistas de dados devem trabalhar com os interessados em toda a empresa – ou numa unidade de negócio definida – para clarificar os objetivos do negócio, compreender a aplicação potencial da ciência de dados a estes objetivos e desenvolver um plano para testar como a ciência de dados poderia ser utilizada. 

Por exemplo, um grande retalhista que utilize um esquema de adesão para oferecer descontos aos membros pode estar preocupado em perder membros. 

O objetivo comercial pode ser reduzir a rotatividade dos membros e melhorar a retenção.

É incrivelmente importante que, nesta altura, se estabeleça um nível de base de desempenho em relação ao qual se possa avaliar quaisquer técnicas futuras de ciência de dados.

Por outras palavras, saber «até que ponto tomamos atualmente decisões sobre esta questão» e, por conseguinte, ser capaz de avaliar a diferença proporcionada por técnicas futuras.

Na fase de «compreensão de dados», o trabalho implicaria investigar que dados existem para abordar a questão da retenção de membros. 

Um engenheiro de dados ou um cientista de dados exploraria, testaria e verificaria a qualidade dos dados.

A fase seguinte de «preparação de dados» envolveria a seleção, limpeza, interrogação e formatação de dados para os tornar prontos para análise.

Subsequentemente, o cientista de dados passaria à fase de «modelação», escolhendo uma ou várias técnicas de modelação, e adequaria cada um dos modelos escolhidos aos dados. Tudo isto teria como objetivo a redução da rotatividade dos membros.

Na penúltima fase, o cientista de dados avaliaria então os resultados. 

  • O que foi aprendido? 
  • O que deve ser modificado? 
  • Algumas técnicas parecem mais eficazes do que outras? 

Poderão ser feitas mais iterações às abordagens de modelização. 

Até agora, todo este trabalho tem tido lugar fora dos fluxos de trabalho dos negócios. 

Na fase de «implantação», é a função da lista de dados científicos pegar em quaisquer técnicas que se tenham revelado eficazes durante a fase de avaliação e aplicá-las às práticas de trabalho. 

Isto pode envolver, por exemplo, o fornecimento de novos relatórios às equipas centrados na retenção de membros, encorajando-as a experimentar novas formas de envolvimento dos membros. 

O impacto deste trabalho deve ser continuamente revisto, mesmo na fase de destacamento, uma vez que os comportamentos dos utilizadores ou fatores externos podem diminuir a eficácia das técnicas aplicadas ao longo do tempo.

O trabalho de um cientista de dados não é apenas analítico extravagante. 

Abrange conhecimentos de dados, informática, estatística e probabilidade, compreensão dos ambientes empresariais, comunicação com as partes interessadas, capacidades de visualização de dados e compreensão dos regulamentos de dados e considerações éticas. 

Assim, os brilhantes cientistas de dados estão, sem surpresas, em grande procura e a oferta é limitada. 


Problemas que a ciência de dados pode resolver

Uma habilidade altamente importante de um líder de transformação digital é saber quando certas técnicas podem ajudar a resolver problemas de negócios da vida real. 

Muito disto é aprendido através da experiência, tentativa e erro. 

Se estiver a tentar alterar o comportamento de um grupo de utilizadores – para vendas adicionais ou um objetivo específico de conversão, por exemplo -, primeiro, precisa de saber quem são os seus utilizadores.

A ideia inicial foca-se na identificação de padrões em conjuntos de dados, fornecendo características específicas de tais grupos de utilizadores, que podem ser acionáveis por uma organização.

Este tipo de análise é conhecido como clustering

Um cientista de dados, com base nos conjuntos de dados disponíveis, especificaria quantos subgrupos ou clusters estão à procura, e depois executaria um algoritmo de clustering para segmentar e agrupar dados para formar diferentes subgrupos.

Uma empresa de comércio eletrónico que procurasse otimizar as receitas através de campanhas de marketing específicas poderia procurar utilizar técnicas de agregação para agrupar a sua base de clientes em vários segmentos. 

Um segmento de exemplo poderia ser «mulheres solteiras com mais de 45 anos que vivem em áreas urbanas».

Uma vez definidos estes segmentos, a empresa poderia então experimentar diferentes abordagens de marketing adaptadas a estes segmentos, com a hipótese de trabalho de que o marketing personalizado geraria melhores retornos do que a publicidade genérica. 

Como sempre, embora as perceções da ciência dos dados possam ser extremamente poderosas, é necessária uma visão empresarial para verificar se a segmentação que resulta da análise é significativa e relevante para o dia a dia dos negócios. 

Leitura complementar

Automação e os dados na nova economia digital

Inovação e o poder dos dados na valorização da Amazon, Alphabet, Facebook e Alibaba

Persuasão, Ciência e Rendimento: como criar um site 2022

Novos dados sobre as Redes Sociais e o planeamento estratégico em 2022


Qual a sua opinião sobre este tema da A ciência dos dados para informar a tomada de decisões na área digital

Alguma sugestão para complementar informação neste artigo?
Deixe um comentário.

Se este conteúdo pode ajudar alguém, partilhe nas redes sociais.