Atividade Avaliativa 5 - Camila Matutino - Das bases de Dados à Ciência de Dados: Inteligência Artificial, Big Data e Internet das Coisas
Postagem realizada em: 07/06/2021 às 01:26:44 - Última atualização em: 07/06/2021 às 15:35:56
Autor: Camila Fernanda Ribeiro Rocha
Sem dúvida a informação buscada no passado não é a mesma solicitada no presente e não será a mesma a ser procurada no futuro. Antes a pesquisa científica era feita em livros e revistas acadêmicas específicas, hoje se falam em bases de dados e em Inteligência Artificial.
Antes o conhecimento estava limitado por exemplo à lugares específicos como um prédio físico de uma biblioteca. Quando algo ocorria com ele, havia uma grande perda de saberes junto.
Hoje com a Internet e a tecnologia digital, ele pode permanecer vivo e ser acessado em qualquer hora e local do mundo. Essa mudança de panorama causou uma grande revolução na forma como o conhecimento científico se espalhou.
Os saberes não se perdem com facilidade, mas permanecem vivos através de grandes bancos de dados. Estes permitem que novas teorias sejam implementadas e sejam atualizadas com muito mais facilidade.
Apesar de toda esta dinâmica atual, percebe-se ainda a relevância da biblioteca física e dos instrumentos de obtenção "tradicional" do conhecimento. Uma prova disso é que em 2008 foram emprestados mais de 2 bilhões de ítens em bibliotecas dos Estados Unidos e também elas foram visitadas por mais de 1.3 bilhões de vezes no mesmo ano mencionado.
Estes números refletem que a biblioteca no mundo todo mudou a sua configuração. Ela é agora um instrumento de conexão à Internet e principalmente de acesso à instrumentos tecnológicos que podem fazer com que o usuário consiga encontrar com facilidade o conhecimento que ele procura.
Na Noruega por exemplo há uma biblioteca de referência onde tudo é informatizado. O usuário é completamente independente para buscar os saberes que ele procura da forma como melhor lhe agradar. Instrumentos de Inteligência Artificial o auxiliam no processo de acordo com o perfil da pessoa que está a usar o serviço.
Pode-se dizer através deste exemplo que a tendência é que a biblioteca atual global se torne um jardim murado. De acordo com a concepção de Mike Johnson, este conceito seria um ecossistema fechado de produtos, tecnologias e serviços.
E toda esta conceituação pode ser aplicada também em vários tipos de serviços de plataformização da Internet. A intenção desta nova dinâmica de conexão digital, é reter cada vez mais a atenção do usuário ao ambiente desejado. Um exemplo disso é o trabalho Shoshana Zuboff. Ela propõe um novo gênero de capitalismo que monetiza dados de segurança. Algo que sem dúvidas é um jardim murado.
Este panorama pode ser visto com mais clareza na chamada Economia da Atenção. Focar o engajamento em apenas um item de informação é algo que veio para ficar. O Instagram por exemplo possui recursos para entreter o usuário antes de uma chamada ao vivo de acordo com o perfil do usuário desta rede social. Em outras palavras, ele foca a atenção de quem está a acessá-lo com conteúdos exclusivos - como um muro que o cerca.
Todo este processo atual trazido até aqui coloca com ele uma questão importante: há a necessidade de se educar digitalmente. Sem isso, não haverá uma utilização produtiva dos recursos tecnológicos em termos de pesquisas científicas e de comunicação.
Uma comprovação deste fato é que em 2020 foi feita nos Estados Unidos uma pesquisa por um grupo de consultoria denominado McKinsey. Eles colocaram que há a escassez de quase 200.000 pessoas neste país que saibam utilizar a Big Data para tomar decisões organizacionais eficazes.
E no mundo todo a tendência é este padrão se repetir. Falta muita educação em termos tecnológicos. Com o avanço da chamada Internet das Coisas, que permite uma melhor coleta de dados em tempo real, toda esta questão tem sido deixada em segundo plano. Aprender a mexer em recursos tecnológicos é algo que fica "deixado de lado" diante de um dado acessado em poucos segundos.
Neste sentido, não se pode falar de acesso rápido à informação sem mencionar a chamada explosão informacional. A quantidade de saberes que eram armazenados nos primeiros computadores mundiais, hoje podem ser armazenadas com facilidade dentro de um celular e ainda se terá espaço para mais informações.
Lidar com tamanha quantidade de volumes de dados é sem dúvidas um grande desafio . O MIT Technology Review fez em 2020 uma pesquisa com empresários para saber como eles lidam com esta questão. Ela abrangeu mais de 2.3 mil líderes empresariais do mundo todo e 78% deles disseram ter dificuldades em digerir, analisar e interpretar grandes volumes de dados.
Dentro deste contexto é relevante mencionar que desvendar um dado informacional passa em primeiro lugar por fatores como sua velocidade, sua vulnerabilidade, seu volume, sua variedade, seu valor, sua visualização; entre outros. É um complexo conjunto de relações a serem feitas.
Em relação à conexão para se poder acessar os dados informacionais, percebe-se uma evolução da Internet em etapas - da primeira geração - 1G até a quinta geração - para a 5G (que é a mais atual).
O 1G foi implantado em 1980 e é caracterizado pela voz analógica. Em 1990 surge o 2G e com ele novos recursos são colocados como a voz digital e as mensagens de texto. No ano de 2008 o 3G é trazido à tona e com ele vem inovações como a integração de voz e a Internet Móvel. Na evolução do tempo, em 2014 é implantado o chamado 4G e com ele vem a alta capacidade de dados multimídia. E por último em 2020 vem o chamado 5G e com ele são trazidas novidades que serão possivelmente o futuro da conexão como por exemplo a flexibilidade, aplicações inovadoras, densidade e alta velocidade.
Para se ter uma dimensão da passagem do 4G para o 5G e de como este último será muito mais avançado em relação às formas de conexão anteriores serão descritos alguns aspectos que demonstrem esta realidade como por exemplo:
- o 5G terá 100 vezes mais velocidade máxima se comparado ao 4G;
- a latência do 5G será divida 100 vezes em relação ao 4G;
- as conexões simultâneas serão 10 vezes maiores no 5G se comparadas ao 4G;
- consumo de energia no 5G será 90% menor em relação ao 4G;
e por último pode-se citar o corte de rede - que é a principal implantação do 5G. Este seria um sistema que permite dar suporte a um aplicativo, serviço, conjunto de usuários ou rede específica de forma mais fragmentada. Isso permitirá que uma maior velocidade e eficiência deste tipo de conexão online.
A tecnologia chinesa e americana tem sido as principais fontes de implantação do 5G no mundo todo. Elas disputam colocar este sistema de conexão online não só em seus países mas em outras nações. O 5G é em resumo o futuro da conectividade.
Para se ter uma dimensão da influência da Internet globalmente, abaixo serão mostrados alguns dados coletados por uma pesquisa feita pelo Hootsuite We Are Social no ano de 2020. Este estudo revelou que:
- 57% da população mundial acessa à Internet ; ou seja, há aproximadamente 4.3 bilhões de internautas.
- 52% da população mundial acessa a Internet pelo celular; ou seja, aproximadamente 3.9 bilhões de internautas.
- 45% da população mundial está ativa nas redes sociais - ou seja, há aproximadamente 3.4 bilhões de usuários delas.
-42% da população mundial acessa as redes sociais por dispositivos móveis.
No Brasil:
- 70% da população do país está conectada à Internet
- 66% da população é ativa nas redes sociais
- 61% acessa as redes sociais por dispositivos móveis
Esta pesquisa citada revelou também que no Catar 99% da população acessa à Internet por intermédio de dispositivos móveis; enquanto que na Coreia do Norte este número é de 0,04%.
Por último, este estudo constatou que na Ásia-Pacífico são gastos 19.43 bilhões de gigabytes por mês; na América do Norte este número é bem menor - 3.57 bilhões de gigabytes por mês e na América do Sul este valor chega à 2.09 bilhões de gigabytes por mês.
Estes números demonstram a influência das redes sociais na economia e na sociabilidade mundiais. É a chamada Social Data ou como se diz - a mina de ouro dos dados.
Para se ter uma ideia deste panorama de forma mais ampla, constatou-se que no Facebook existem mais de 2.5 bilhões de usuários e que cerca de 510.000 comentários são escritos nele por minuto. No Twitter, cerca de 347.000 mensagens são adicionadas nele por minuto. Nele os tópicos mais comentados, contribuem para a chamada análise preditiva dos dados; ou seja, identifica a probabilidade de resultados futuros a partir dos dados para a tomada de decisões.
E a importância da conectividade não se restringe atualmente à recursos eletrônicos como recusos móveis ou desktops. Ela abrange também produtos eletrônicos dos mais variados tipos. Cerca de 90% deles tem alguma interação com a Social Data ou Enterprise Data.
De todo este panorama citado até aqui, pode-se perceber que os dados passam a ter valor de negócio; perdê-los pode significar deixar uma oportunidade passar - ou seja, estar ultrapassado. Por isso resguardar dados importantes e montar política de segurança de informações sigilosas tornou-se algo fundamental dentro das empresas. A Lei Geral de Proteção de Dados surgiu então como um instrumento fundamental para fiscalizar e auxiliá-los neste processo.
Neste contexto, a procura por profissionais que saibam limpar, gerenciar, analisar e visualizar os dados de forma correta é cada vez maior. São chamados os profissionais da ciência de dados.
A Ciência de Dados seria um área interdisciplinar voltada para o estudo e a análise de dados (sejam estes estruturados ou não). Ela busca através da "mineração dos dados" extrair conhecimentos e insights necessários à tomada de decisões.
Pode ser definido também como um ecossistema profissional que reúne três áreas diferentes: a estatística, ciência da computação e a abundância de dados. Este ramo científico tem influenciado vários setores como a saúde, comércio e governo.
Dentro da Ciência de Dados o dado é trabalhado da seguinte forma: primeiro ele é obtido, depois filtrado para posteriormente ser explorado, modelado e interpretado.
Em uma perspectiva mais abrangente, pode-se dizer que a linguagem de programação de dados é formada basicamente por três fatores reunidos: 1- as estatísticas (formulação de modelos matemáticos algorítmicos que estimam a probabilidade de ocorrência de eventos); 2- a Inteligência Artificial ( simulação de inteligência e comportamento humano na execução de tarefas por máquinas) e 3 - o chamado Machine Learning (reconhecimento de padrões na tomada de decisões automáticas). Todo esta reunião de fatores pode ser chamado de Data Mining - ou Mineração dos Dados - principal vetor da Ciência de Dados.
Quando se fala em Ciência de Dados o que se pensa é algo exato, sem erros. Porém na prática isso nem sempre acontece. Em âmbitos como a classificação de documentos, o mercado de ações, marketing digital, jornalismo de dados, aplicações bancárias e as recomendações das plataformas de streaming muitas vezes possuem fatores que não podem ser previstos pela automação de dados. São preferências, opiniões, ações que muitas podem se alterar com o tempo ou então que são diferentes do que uma maioria de dados pode colocar como certa. Isso não tira por outro lado de forma alguma a relevância deste campo científico e de sua enorme contribuição para o desenvolver de novos saberes.
De tudo que foi abordado até aqui pode-se depreender que trabalhar com dados e transmitir através deles uma informação relevante não é algo tão simples quanto parece à uma primeira vista.
Pelo contrário, é um processo que demanda muito estudo e preparação. Por isso cientistas de dados serão cada vez mais requisitados em um mundo que está em evolução científica, tecnológica e principalmente interconectado em todos os sentidos.
O profissional da informação que atua em um serviço de informação ou em uma biblioteca já é um cientista de dados ou um bibliotecário de dados. Não como desvincular esta profissão da questão do tratamento de dados.
Por isso este especialista deve estar sempre atendo às mudanças nas necessidades de pesquisas; além de reconhecer se o suporte em que os dados estão colocados são suficientes para atender à demanda de onde ele atua. Sua atenção deve estar voltada para reconhecer novas oportunidades de colaborar com um melhor tratamento dos dados.
Seus desafios são muito grandes neste contexto. A educação formal de profissionais da informação é muito deficiente no mundo todo. No Brasil, esta formação é bem inferior ao que deveria ser. Há uma sobrecarga e opressão para que este profissional adquira habilidades que muitas vezes não podem ser ensinadas rapidamente.
Enfim, formar alguém com estrutura e liderança para trabalhar com dados é o futuro profissional não só do denominado profissional da informação, mas é uma tendência a ser algo espalhado para as mais variadas profissões.
Por isso se educar digitalmente é adquirir não só os saberes do passado e aplicá-los no presente, mas é construir também o futuro de toda uma gama de profissões.
PINHEIRO, L.V.R. Comunidades científicas e infra-estruturatecnológica no Brasil para uso derecursos eletrônicos de comunicação einformação na pesquisa. Ci. Inf., Brasília, v. 32, n. 3, p. 62-73, set./dez. 2003.
PINHEIRO, L.V.R.; LOUVEIRO, J.M.M. Traçados e limites da Ciência da Informação. Ci.Inf., Brasília, DF, v.47 n.1, p.62-62, jan/abr. 2018.
SOUZA, R. R.; ALMEIDA, B.; BARACHO, R. M. A. Ciência da Informação em transformação: Big Data, Nuvens, Redes Sociais e Web Semântica. Ci. Inf., Brasília, DF, v. 42 n. 2, p.159-173, maio/ago. 2013.