Era Big Data Kimia
Ilmu kimia telah mengalami pergeseran paradigma khususnya yang berkaitan dengan data. Berkembangnya 'data besar' (big data) saat ini mendorong penemuan baru dalam bidang kimia semakin cepat. Meskipun era modern big data masih dalam tahap awal, data telah memainkan peran integral dalam sejarah perkembangan ilmu kimia. Sejak lama, para ahli kimia telah memprioritaskan dokumentasi dan berbagi ilmu pengetahuan melalui penyajian data, dimulai dari pembentukan komunitas kimia, lalu berkembang ke jurnal dan terbitan berkala yang terorganisir dengan baik menggunakan sistem kartu indeks (card index system).
Pada awal abad ke-19, para ahli kimia menyadari nilai dari data kimia yang dikompilasi, sehingga lahirlah katalog-katalog kimia seperti Beilstein Handbook of Organic Chemistry dan Gmelin Handbook of Inorganic Chemistry. Data ini memungkinkan para ahli kimia untuk belajar dan membangun pengetahuan berdasarkan pencapaian para ahli sebelumnya.
Pada abad berikutnya, katalog yang lebih terstandarisasi mulai bermunculan, seperti Chemical Rubber Company (CRC) Handbook dan International Union of Pure and Applied Chemistry (IUPAC) Color Books.
Pada pertengahan abad ke-20, dengan hadirnya komputer, para ahli kimia mulai mengumpulkan data struktur dan sifat kimia dalam format elektronik. Bahkan, para ahli kimia termasuk yang pertama memanfaatkan komputer untuk penyimpanan dan pencarian literatur ilmiah, mengembangkan berbagai struktur data dan teknik pencarian melalui Chemical Abstracts Service (CAS).
Meskipun istilah "cheminformatics" baru lahir pada 1998, penggunaan teknik informatika dan data kimia untuk menyelesaikan permasalahan dalam bidang kimia sudah dimulai sejak data elektronik mulai tersedia. Karya awal yang memanfaatkan data ini menunjukkan kepada dunia kimia dan ilmu pengetahuan pada umumnya betapa pentingnya ketersediaan data dalam mendorong kemajuan sains. Cheminformatics, terutama dalam bidang penemuan obat (drug discovery), menjadi pelopor dalam penggunaan Quantitative Structure Activity Relationships (QSAR), yang kemudian berkembang ke prediksi sifat berbasis machine learning (ML).
Saat ini, pentingnya data dalam kimia semakin meningkat seiring dengan ekspansi eksponensial dalam menghasilkan data kimia baru. Kekuatan komputasi yang lebih besar memungkinkan simulasi berkecepatan tinggi (high-throughput simulations), algoritma yang lebih canggih mendukung model generatif untuk merancang struktur kimia baru, dan berkembangnya laboratorium otomatis (self-driving laboratories) memungkinkan pembuatan data eksperimen berkecepatan tinggi dalam skala besar.
Ratusan basis data kimia kini telah tersedia, mulai dari basis data khusus bidang tertentu berskala menengah hingga repositori besar seperti PubChem, Cambridge Structural Database, Protein Data Bank, Materials Data Facility, Spectral Database for Organic Compounds (SDBS), Crystallography Open Database dan NOMAD.
Akses terhadap data kimia juga semakin luas. Sebagian besar basis data kini tersedia secara daring, termasuk repositori besar seperti SciFinder (yang dirilis oleh CAS) dan Reaxys (yang mencakup data Gmelin dan Beilstein), serta metadata hampir seluruh literatur kimia yang tersedia melalui platform seperti Web of Science. Bahkan Gold Book, versi modern IUPAC dari Color Books, kini dapat diakses secara online.
Meskipun akses ke data tersebut belum sepenuhnya gratis dan merata, data ini memiliki potensi besar untuk menginformasikan dan mengarahkan penelitian lintas disiplin ilmu. Aplikasi berbasis data yang sudah ada mencakup mulai dari prediksi sifat material, perancangan obat secara de novo, hingga sintesis otomatis dengan robot. Keberhasilan dalam bidang komputasi telah mendorong upaya untuk mengintegrasikan pendekatan berbasis data ke dalam kimia eksperimental secara lebih luas.
Sulit membayangkan kemajuan kimia tanpa keberadaan gudang data kimia yang krusial ini.
Sumber: Promises and Perils of Big Data: Philosophical Constraints on Chemical Ontologies
Arsip
Blogroll
- Masih Kosong