Le prime base di dati biologici si hanno a partire dal 1968 con il lavoro di Margaret Dayhoff 'Atlas of protein sequence and structure', questo fu il primo tentativo di conservare le informazioni riguardanti le sequenze amminoacidiche, ne raccolte 65.
In seguito, fu fondata Swiss-Prot, poi riunita insieme ad TrEMBL nell'UniProt, nel 1971 fu fondato il Protein Data Bank (PDB), che, all'epoca, conteneva appena 7 strutture proteiche. Da allora si è reso protagonista di una crescita esponenziale nel numero di strutture. In seguito, negli anni 80' fu fondata l'EMBL (European Molecular Biology Laboratory), il primo database di sequenze nucleotidiche e nel 1982 GenBank, contenente sequenze nucleotidiche e loro traduzioni amminoacidiche.