Plataforma Scylax e a Análise de Dados sobre Pesquisas Acadêmicas

Lisandra Melo - Nov 9 '21 - - Dev Community

Pesquisa Acadêmica e o Scylax

O processo de realização de pesquisas científicas é parte imperiosa durante a formação acadêmica. Visto que, tal processo fomenta o desenvolvimento da construção de conhecimento, promovendo a concretização do que se é proposto em sala de aula de forma interdisciplinar e palpável, possibilitando assim a atuação universitária sob os três pilares da universidade: ensino, pesquisa e extensão. Nesse sentido, é notável que pesquisas acadêmicas são bases fundamentais para o exercício adequado de centros acadêmicos universitários.

“Art. 207. As universidades [...] obedecerão ao princípio da indissociabilidade entre ensino, pesquisa e extensão.” (Constituição Federal, 1988)

Nessa perspectiva, é notável que o que se é produzido nas pesquisas acadêmicas constitui-se de dados de elevada relevância para a análise da qualidade e da circunstância de universidades ou quaisquer outros centros educacionais. Para agrupar todos esses dados, foi desenvolvida a plataforma Scylax, que tem como objetivo fornecer informações sobre pesquisas relacionadas a docentes, instituições, centros, departamentos e diversos outros membros componentes da universidade.

Características do Scylax

A plataforma obtém dados a partir de plataformas como Lattes, Scopus e Orcid e diante dos dados fornecidos fornece a visualização de informações como: total de produções, Qualis de produções, quantidade de produções com colaboração, áreas de pesquisa e tipo de pesquisa. Além disso, o Scylax fornece a funcionalidade de comparação de informações entre pesquisadores ou organizações educacionais.

Com ela também é possível visualizar e extrair informações relevantes a respeito das pesquisas por pesquisadores e instituições de ensino de forma prática e rápida. Esses dados, por sua vez, podem ser usados por diversas organizações e seus membros para avaliar o impacto e alcance de suas produções, a relevância de suas colaborações e áreas correlatas aos temas estudados.

Sendo assim, a ferramenta funciona como um acurado medidor de desempenho acadêmico, onde diversas instituições de pesquisa, que necessitem de dados de diferentes plataformas, podem recorrer seja para avaliar um candidato a bolsa ou reconhecer os trabalhos de maior destaque e relevância.

Possibilidades com os Dados

Sabemos que os dados que estejam brutos, ou seja, não estão dispostos de maneira organizada e analisados de maneira isolada não apresentam qualquer fundamento. Por isso, é necessário o processamento e relacionamento desses dados, a fim de gerar informação.

Contudo, há dois principais problemas na produção de informação, o primeiro deles é a coleta de dados: geralmente os dados são gerados em formatos, estruturas e tamanhos diferentes. O segundo problema é como será feito o armazenamento dessas informações: é preciso que os dados estejam bem estruturados para facilitar seu uso nas bases de dados.

Pensando nisso, existe um processo chamado ETL, que vem de Extract, Transform e Load (Extração, Transformação e Carregamento). ETL é um processo de integração de dados, relacionando dados de diversas fontes e gerenciando o armazenamento em um banco de dados centralizado.

As etapas da ETL:

  • Extração
    Na etapa de extração os dados brutos são coletados de sua fonte original, por meio de API, banco de dados, raspagem ou outros sistemas. Esses dados são ajustados e unificados,e ficam na espera de serem transformados.

  • Transformação
    Nesta etapa, os dados são processados, limpos e consolidados, a fim de que fiquem livres de quaisquer ruídos ou inconsistências. Também nesta etapa, os dados são agrupados de acordo com características similares.

  • Carregamento
    Na última etapa, os dados transformados são carregados para uma estrutura de banco de dados.

Portanto, vimos que sem o uso de um método como o ETL seria muito difícil analisar as informações coletadas e por consequência não poderíamos resolver os problemas propostos.

Finalmente, sob posse dos dados reunidos pela plataforma Scylax e fazendo uso de ferramentas que auxiliem no processamento e relacionamento dessas informações, será possível realizar diversos tipos de estudos, como análises correlacionais, com os dados disponibilizados e agrupamentos baseados em características similares entre organizações educacionais ou pesquisadores.

Conclusão

Espera-se, dessa forma, que a partir da continuidade do estudo do tema, a preparação e análise dos dados fornecidos, a construção de um estudo agregador às informações já presentes na plataforma.

O texto acima foi desenvolvido a partir do esforço conjunto de Lisandra Melo, Kaio Menezes, Paulo Belarmino, Debora Gizele e Kelmo Alexandre. Este foi utilizado durante a avaliação parcial da disciplina de Ciências de Dados do curso de Bacharelado de Tecnologia da Informação oferecido pelo Instituto Metrópole Digital da Universidade Federal do Rio Grande do Norte.

. . . . . . . . . . . .