A base de dados Prosopon foi construída a partir dos processos de bolsas e auxílios julgados nas reuniões do Conselho Deliberativo do CNPq. Foi, assim, montada uma planilha para cada ano, onde foram registrados os dados disponíveis sobre cada processo, como data da ata, número do processo, tipo de benefício, beneficiário da bolsa ou auxílio e várias outras informações. As informações foram retiradas das atas das reuniões do Conselho Deliberativo, complementadas por informações disponíveis nos anais no período de 1951 a 1973. Os anais descrevem as discussões e resoluções realizadas na reunião do Conselho Deliberativo, redigidos a partir de registros taquigráficos, enquanto as atas contêm apenas a deliberação final sobre cada solicitação. Quando havia discordância entre elas, foi considerada a informação constante das atas, visto que era a resolução final que seguia para implementação.
Prosopon foi, então, estruturada segundo o nome dos cientistas (homens e mulheres), e para cada nome constam os processos em que ele está envolvido. Os cientistas são identificados como solicitante, beneficiário ou orientador, de acordo com a função que desempenham no processo. Assim, num processo o cientista pode ser o beneficiário e em outro o orientador. Em muitos casos, o cientista pode ter mais de uma função, como, por exemplo, ser ao mesmo tempo o solicitante e o beneficiário do auxílio. Os resultados da busca indicarão todos os processos relacionados a um determinado cientista, seja qual for a sua forma de participação. Um processo também pode estar associado a diferentes nomes, cada um numa função diferente. Nesse caso, o processo aparecerá várias vezes, relacionado a cada um dos cientistas indicados.
Devido a inúmeras diferenças de grafias e abreviações, foi realizado pela equipe do projeto um exaustivo trabalho de unificação dos nomes, buscando a sua forma mais completa. No caso de mulheres, que aparecem em alguns processos com os sobrenomes de solteira e em outros com os de casada, foram incluídos todos os sobrenomes, mesmo que a cientista tenha excluído um deles ao se casar. Isso permite que a cientista seja localizada tanto pelo nome de solteira como de casada, independente da época em que a solicitação foi julgada pelo CNPq. A lista inicial, com mais de 22.000 nomes, foi reduzida para pouco mais de 17.000. É possível que ainda existam sobreposições de nomes. Assim, recomenda-se, sempre que possível, fazer a pesquisa utilizando diferentes padrões de busca, de forma a verificar se o cientista aparece com mais de uma grafia.
A partir das informações constantes nas atas e anais, indicamos a instituição a qual o cientista (seja ele solicitante, beneficiário ou orientador) estava vinculado quando da solicitação do benefício. Assim, é possível que um cientista apareça vinculado a mais de uma instituição, seja porque ele mudou de instituição, seja porque a instituição mudou de nome. No período abarcado pela base (1951-1973) foram renomeadas várias universidades e criadas outras tantas reunindo faculdades e institutos já existentes.
Para tentar minorar este problema, utilizamos a descrição da instituição até o terceiro nível (por exemplo, Universidade do Brasil, Faculdade Nacional de Filosofia, Departamento de Física). Assim, será recuperada na busca seja qual for a situação daquela instituição ou unidade na época em que foi solicitado o apoio ao CNPq. Foi criado um sistema correlacional de nome das instituições. Ao buscar Universidade do Brasil aparecerão tanto os registros relacionados à Universidade do Brasil, como a sua sucessora - a Universidade Federal do Rio de Janeiro.
Com relação ao local onde está situada a instituição ao qual o cientista está vinculado foi utilizado o estado, no caso do Brasil, ou o país, no caso do exterior. Utilizamos sempre que possível o nome do país na época, ou seja, Tchecoslováquia, União Soviética etc.
Foi criado um campo de busca por ano (na busca avançada), definido pela data da ata. Assim, é possível que um auxílio tenha sido julgado e registrado na ata num determinado ano e só tenha começado a vigorar no ano seguinte, ou que a bolsa tenha perdurado por vários anos após o julgamento da solicitação.
Foi incluída na base de dados a informação sobre o gênero do cientista. Apesar de não ser explicitada diretamente nas atas, muitas vezes está implícita como, por exemplo “foi concedido à professora...”. O gênero também foi depreendido a partir de nomes tipicamente masculinos ou femininos e por buscas sobre o cientista na internet. Convém ressaltar que na época a que se refere este levantamento não era comum a caracterização de gênero neutro ou do uso de nome social, por isso mantivemos apenas as categorias masculino e feminino.
Outro campo inserido na base de dados foi da área de conhecimento do cientista. Para tal informação, utilizamos principalmente a comissão que avaliou a solicitação, complementada pelo setor do CNPq responsável pelo processo ou mesmo a instituição (ou instituições) a qual o cientista estava vinculado na época. Dessa forma, foi utilizada uma nomenclatura e estrutura de áreas do conhecimento semelhante à utilizada na época pelo CNPq, a saber: agronomia e veterinária; astronomia, física e matemática; biologia e ciências biomédicas; ciências sociais; finanças, intercâmbio e administração; oceanografia; química e geologia; e tecnologia.