Pacote: pharmaverse

Fernanda Kelly
21 de set de 2023
7 min de leitura

Atualizado: 3 de out de 2023

Que eu tenho um pé na área da saúde não é novidade pra ninguém né? Então,

Vamos falar do universo pharmaverse?

A fim de começar a entrar nesse universo, primeiro vamos ter que entender o papel da Food and Drug Administration (FDA) nos Estados Unidos. A FDA é responsável por proteger a saúde pública, garantindo a segurança, eficácia e proteção de medicamentos humanos e veterinários, produtos biológicos, dispositivos médicos, abastecimento de alimentos, cosméticos e produtos que emitem radiação. É nesse momento que você se pegunta,

É estilo a nossa ANVISA?

Sim! Mas a FDA é um pouco mais preocupada com os bancos de dados que fomentam as pesquisas que são de sua responsabilidade em fiscalizar. Então, a partir disso, imagina o seguinte cenário: diferentes organizações buscando os mesmos padrões de resultados.

Como assim mesmo padrão?

O essencial e importante a saber é que, em poucas palavras, as empresas farmacêuticas devem seguir uma série de procedimentos e formatos padronizados ao submeter resultados clínicos às autoridades de saúde (FDA, por exemplo). Alguns desses formatos ou padrões foram desenvolvidos pela Clinical Data Interchange Standards Consortium (CDISC), sendo um dos mais conhecidos e utilizados o padrão Study Data Tabulation Model (SDTM). Há também o padrão ADaM, mas esta padronização é focada no modelo de dados de análise.

O SDTM é uma estrutura utilizada para organizar dados coletados em ensaios clínicos com foco humanos. E como eu havia comentado anteriormente, é obrigatório que as organizações usem o padrão SDTM ao enviar dados clínicos a FDA.

E tudo isso é pra quê?

Para facilitar a análise e o reporte por parte do regulador, mas veja que há benefícios para as organizações, como: os estudos são mais consistentes, porque estão todos no mesmo formato padrão, melhor qualidade dos dados e menos erros, avaliações internas mais rápidas e fáceis. Isso permite que o compartilhamento e a reutilização de dados seja mais simples.

Seria incrível ter isso no BR né?

Mas já que não tem... Vamos focar na vaguinha da nossa querida América do Norte? Eu tô focada e a partir de agora esse post passa a ser uma introdução do CDISC SDTM com uma pincelada nos pacotes do universo pharmaverse.

O SDTM possibilitou nomes de domínio padrão, uma estrutura padrão para cada domínio, variáveis e nomes padrão para conjuntos de dados SDTM. E de tanto falar em domínios, estes são uma coleção de observações logicamente relacionadas com um tópico comum e específico que normalmente são coletadas para todos os sujeitos em uma investigação clínica. Os domínios SDTM são divididos nas seguintes classes: domínios para fins especiais, aulas de observação geral, descobertas sobre, projetos de teste e conjuntos de dados de relacionamento.

Tá ficando confuso?

É, confesso que realmente é confuso se você não é da área de pesquisa clínica, mas vamos juntes que vai dar certo.

Na minha opinião, o domínio mais chatinho é o aulas de observação geral. Ele aborda as intervenções, eventos e descobertas de um ensaio clínico. As intervenções são os conjuntos de dados que capturam procedimentos e tratamentos que são administrados a um sujeito conforme especificado pelo protocolo.

Alguns exemplos são a exposição (EX), medicamentos concomitantes (CM) e uso de substâncias (SU) como tabaco, cafeína e álcool. Já os conjuntos de dados de eventos são aqueles que capturam marcos planejados do protocolo, como randomização e conclusão do estudo, incidentes não planejados que ocorrem antes ou durante um estudo, como eventos adversos (EA). As descobertas capturam observações que abordam questões específicas, como feitas durante exames físicos, testes laboratoriais, teste de ECG e também captura dados relacionados às classes de intervenção e eventos. Alguns exemplos são os sinais vitais (VS), exame físico (PE), laboratórios (LB) e características do indivíduo (SC). Ou seja?

Um domínio é simplesmente um grupo de observações que compartilham um tópico comum.

Há uma grande coleção de domínios dentro das classes, e o CDISC está constantemente desenvolvendo mais, então não se preocupe em saber todos nesse primeiro momento. O importante é entender que cada domínio SDTM geralmente consiste em um arquivo com o nome do domínio, por exemplo, se estamos falando de Eventos Adversos (Adverse Events), provavelmente o arquivo de dados será nomeado por AE.xlsx.

A vista disso, podemos dizer, racionalmente, que todas as empresas enfrentam os mesmos desafios nessa etapa. Algumas farmacêuticas já estavam trabalhando no desenvolvimento de soluções em R de forma independente e, isso acarretou no total de quase 10.000 outros pacotes (hoje, quase 20.000 ) voltados a essa problemática. E isso levou a outras duas perguntas:

Com este número esmagador de pacotes no CRAN, como encontrar aqueles relacionados à resolução de “problemas de relatórios clínicos”?

Encontrados os pacotes, como escolher qual usar dentre aqueles que possuem a mesma finalidade funcional?

Assim, mais uma vez, as empresas recomeçaram a trabalhar em conjunto para encontrar essas respostas. Mas agora, em grupos colaborativos e com objetivos comuns: criar pacotes extremamente úteis para resolver lacunas específicas do setor farmacêutico de uma só vez e resolvê-las bem.

As grandes farmacêuticas Roche, GlaxoSmithKline (GSK), Atorus, Janssen e Novo Nordisk se uniram e formalizaram o pharmaverse e formaram seu próprio conselho. O nome pharmaverse foi escolhido para que pudesse ser uma casa neutra, sem qualquer relação com qualquer empresa.

Ao todo são 23 pacotes que fazem parte do universo pharmaverse. São eles:

admiral: Fornecer uma caixa de ferramentas modularizada e de código aberto que permita à comunidade de programação farmacêutica desenvolver conjuntos de dados ADaM em R.

covtracer: Este pacote fornece utilitários para vincular uma variedade de informações de testes e pacotes para apresentar uma imagem mais completa de como um teste foi executado.

datacutr: Fornecer uma ferramenta de código aberto que permita à comunidade de programação farmacêutica aplicar um corte de dados aos dados SDTM em R.

envsetup: O objetivo deste pacote é oferecer suporte à configuração do ambiente R.

ggsurvfit: O pacote ggsurvfit facilita a criação de números resumidos do tempo até o evento (também conhecido como sobrevivência) com ggplot2.

logrx: O objetivo do logrx é facilitar o registro em um ambiente clínico com o objetivo de tornar o código facilmente rastreável e reproduzível.

metacore: O objetivo do metacore é estabelecer uma base comum para o uso de metadados em uma sessão R. Isso é feito criando um objeto R que pode conter os dados necessários em uma estrutura padronizada e imutável (usando R6) que facilita a extração das informações necessárias quando necessário.

metatools: O objetivo das metatools é permitir o uso de objetos metacore. Metatools podem ser usados para construir conjuntos de dados ou aprimorar colunas em conjuntos de dados existentes, bem como verificar conjuntos de dados em relação aos metadados no metacore.

pharmaRTF: O pacote pharmaRTF consome uma tabela huxtable e preenche as peças que faltam, oferecendo opções de propriedade do documento, exibição adequada de várias páginas, títulos e notas de rodapé armazenados nos cabeçalhos e rodapés dos documentos.

pkglite: Uma ferramenta, gramática e padrão para representar e trocar código-fonte do pacote R como arquivos de texto. Converte um ou mais pacotes fonte em um arquivo de texto e restaura as estruturas do pacote do arquivo.

riskassessment: É um pacote R contendo um front-end shiny para aumentar a utilidade do riskmetric pacote dentro de um contexto organizacional.

riskmetric: É uma estrutura para quantificar o “risco de uso” de um pacote R, avaliando uma série de métricas significativas projetadas para avaliar as melhores práticas de desenvolvimento de pacotes, documentação de código, envolvimento da comunidade e sustentabilidade do desenvolvimento.

rtables: O rtables foi projetado para criar e exibir tabelas complexas com R. As células em um rtable podem conter qualquer estrutura de dados de alta dimensão que pode então ser exibida com instruções de formatação específicas da célula.

sdtmchecks: O pacote sdtmchecks contém funções para identificar problemas comuns de dados em dados SDTM. Essas verificações pretendem ser generalizáveis , acionáveis e significativas para análise.

teal: É uma estrutura de exploração interativa baseada em shiny para análise de dados.

tern: O pacote tern contém funções de análise para criar tabelas e gráficos usados para relatórios de ensaios clínicos.

tfrmt: O pacote tfrmt fornece uma linguagem para definir metadados relacionados à exibição, que podem então ser usados para automatizar e atualizar facilmente formatos de saída.

tidyCDISC: É um aplicativo shiny para criar facilmente tabelas e figuras personalizadas a partir de conjuntos de dados ADaM.

tidytlg: O objetivo do tidytlg é gerar tabelas, listagens e gráficos (TLG) usando o Tidyverse. Isso pode ser alcançado de várias maneiras com este pacote.

Tplyr: Este pacote possui uma gramática de formato e resumo de dados voltada para rastreabilidade. Ele foi projetado para simplificar a criação de resumos clínicos comuns e ajudá-lo a se concentrar na forma como apresenta seus dados, em vez de realizar resumos redundantes. Além disso, para cada resultado que o Tplyr produz, ele também produz os metadados necessários para fornecer rastreabilidade da fonte ao resumo.

valtools: Este pacote ajuda a automatizar a validação de pacotes R usados em pesquisa clínica e desenvolvimento de medicamentos: fornece modelos úteis e funções auxiliares para tarefas que surgem durante a configuração do projeto e o desenvolvimento da estrutura de validação.

visR: O objetivo do visR é permitir visualizações e tabelas reutilizáveis e adequadas à finalidade, focadas em pesquisas clínicas e médicas, com padrões sensatos e baseadas em princípios gráficos sólidos .

xportr: Este pacote foi projetado para ajudar a preparar seus arquivos xpt para transporte para um aplicativo validador de conjunto de dados clínicos ou para uma agência reguladora. Este pacote tem a funcionalidade de associar informações de metadados a um quadro de dados R local, realizar verificações de validação em nível de conjunto de dados e converter em um arquivo de transporte v5 (xpt).

São muitos pacotes né?

E a tendência é aumentar ainda mais devido a transição das grandes farmacêuticas do SAS para o R. Alguns pacotes já possuem o objetivo de transcrever os aquivos de SAS para o R, como os pacotes xportr e pharmaRTF. Já outros pacotes são voltados a tabelas, visto que na área da saúde as tabelas já possuem um padrão em artigos (Exemplo: tabela 1).

Mas fer, isso aí a gente consegue fazer com outros pacotes, né?

SIM! Veja que os pacotes que são voltados a tabelas já trazem a possibilidade de uso do pacote gt, mas a construção do padrão através desse pacote pode lhe trazer dores de cabeça e muitas horas de programação além do programado devido ao padrão que estamos buscando.

Agora você entende a necessidade de pacotes voltados a esse padrão?

Ao longo do ano vou soltando posts de cada um desses pacotes e explicações sobre essa padronização do CDISC. É muita coisa, então não fica ansiose que conteúdo para estudar temos de sobra.

Espero que tenha gostado. Até mais!

Fernanda Kelly R. Silva | Estatística

Pacote: pharmaverse

Posts recentes

Comentários