Home Opini AI dapat menemukan ilmu fisika baru dengan lebih cepat, namun ada hal...

AI dapat menemukan ilmu fisika baru dengan lebih cepat, namun ada hal yang mengejutkan

5
0


Kecerdasan buatan sudah memainkan peran utama dalam membantu para kosmolog mempelajari alam semesta. Kini, penelitian baru menunjukkan bahwa teknik pembelajaran mesin yang disebut pembelajaran transfer dapat mempercepat pencarian fisika baru dan lebih murah. Namun, penelitian ini juga mengungkapkan kelemahan yang mengejutkan: AI terkadang menjadi sangat bergantung pada apa yang telah dipelajari sehingga mengalami kesulitan dalam mengenali sesuatu yang benar-benar baru.

Studi yang dipublikasikan di Jurnal Kosmologi dan Fisika Astropartikel (JCAP), meneliti bagaimana pembelajaran transfer dapat membantu peneliti mempelajari teori di luar model kosmologis standar.

AI dan pencarian fisika baru

Model standar kosmologi saat ini, yang dikenal sebagai ΛCDM, berhasil menjelaskan banyak fitur alam semesta berskala besar, termasuk perluasannya dan distribusi galaksi. Namun, para ilmuwan yakin model ini bukanlah jawaban pasti.

Pengamatan baru-baru ini telah menimbulkan pertanyaan yang mungkin mengarah pada fisika baru, termasuk efek neutrino masif, perubahan gravitasi, dan evolusi energi gelap. Untuk mengeksplorasi kemungkinan-kemungkinan ini, para peneliti harus menghasilkan sejumlah besar simulasi komputer terperinci, yang masing-masing mewakili alam semesta virtual yang dibangun dari asumsi fisik berbeda.

Memproduksi simulasi ini memerlukan biaya komputasi yang mahal dan seringkali memerlukan daya komputasi yang signifikan.

Menggunakan Pembelajaran Transfer untuk Mengurangi Biaya Simulasi

Para peneliti menyelidiki apakah pembelajaran transfer dapat membuat proses ini lebih efisien.

Pembelajaran transfer memungkinkan sistem AI untuk menerapkan pengetahuan yang dipelajari dari satu tugas ke tugas terkait lainnya. Alih-alih melatih jaringan saraf sepenuhnya pada simulasi yang paling kompleks dan mahal secara komputasi, tim terlebih dahulu melatihnya pada simulasi berbasis ΛCDM yang lebih sederhana. Fase awal ini disebut pra-pelatihan, kemudian diikuti dengan pelatihan tambahan dengan menggunakan model yang lebih canggih termasuk potensi fisika baru.

“Ini pada dasarnya adalah jalan pintas,” kata Adrian Bayer, kosmolog di Institut Flatiron dan Universitas Princeton yang ikut menulis penelitian ini. “Biasanya, orang melatih AI secara langsung pada simulasi yang paling mahal secara komputasi. Sebaliknya, kami menggunakan simulasi ΛCDM yang lebih sederhana dan lebih murah terlebih dahulu untuk memberikan gambaran kepada AI tentang apa yang terjadi, dan kemudian beralih ke model yang lebih kompleks.”

Bayer membandingkan pendekatan belajar dari buku teks.

“Anda membaca buku dasar terlebih dahulu untuk merasakan pengetahuannya,” kata Bayer, “dan kemudian melanjutkan ke buku yang sangat rumit.”

Menurut penulis pertama Veena Krishnaraj, seorang mahasiswa sarjana di Universitas Princeton, strategi ini menyelamatkan AI dari keharusan “mencerna semuanya sekaligus”.

Hasilnya sangat mengejutkan. Dalam beberapa kasus, pembelajaran transfer telah mengurangi jumlah simulasi mahal yang diperlukan lebih dari sepuluh kali lipat.

Ketika pengetahuan sebelumnya menjadi masalah

Studi ini juga mengungkapkan tantangan yang kurang jelas yang disebut transferensi negatif.

Dengan menggunakan perbandingan buku teks Bayer, bayangkan Anda mempelajari kedokteran dari teks pengantar dan kemudian menemukan penyakit langka yang sangat mirip dengan penyakit umum. Pengetahuan yang ada pada umumnya berguna, namun terkadang dapat menimbulkan kesimpulan yang salah.

Masalah yang sama bisa muncul pada sistem AI.

Dalam beberapa kasus, ciri-ciri fisika baru ini menyerupai pola yang telah dikaitkan AI dengan model kosmologis standar. Ketika hal ini terjadi, jaringan yang telah dilatih sebelumnya dapat menafsirkan informasi yang tidak diketahui melalui lensa yang sudah diketahuinya, sehingga lebih sulit untuk mengenali efek yang benar-benar baru.

Para peneliti mengamati efek ini dengan mempelajari simulasi yang melibatkan neutrino masif. Beberapa tanda pengamatan terkait massa neutrino sangat mirip dengan perubahan yang terkait dengan parameter ΛCDM yang disebut σ8, yang mengukur intensitas gugus materi di alam semesta.

Karena kesamaan ini, jaringan saraf terlatih pada awalnya kesulitan membedakan kedua efek tersebut.

“Perpindahan negatif ini tidak terjadi secara acak. Hal ini disebabkan oleh kemerosotan fisik yang mendasari model tersebut,” jelas Krishnaraj.

Dengan kata lain, proses fisik yang berbeda dapat menghasilkan tanda tangan yang sangat mirip, sehingga menyulitkan AI untuk mengidentifikasi parameter yang bertanggung jawab dengan benar.

“Jadi ini adalah sesuatu yang perlu kita waspadai dan coba mitigasinya,” tutupnya.

Janji dan risiko bagi kosmologi masa depan

Hasilnya menyoroti potensi manfaat dan keterbatasan penerapan konsep model dasar dalam fisika. Pendekatan ini secara umum memiliki semangat yang sama dengan teknik yang mendasari sistem AI generatif modern dan model bahasa besar.

Sebagaimana dicatat oleh para peneliti dalam makalahnya, pra-pelatihan dapat mempercepat inferensi, “tetapi juga dapat menghambat pembelajaran fisika baru.”

Sejauh ini, pendekatan tersebut hanya diuji dengan menggunakan simulasi. Langkah selanjutnya adalah menerapkannya pada observasi astronomi nyata.

Tim percaya bahwa pembelajaran transfer dapat menjadi alat penting untuk studi kosmologi di masa depan, yang diharapkan dapat mengumpulkan data presisi tinggi tentang alam semesta dalam jumlah yang belum pernah terjadi sebelumnya di tahun-tahun mendatang.

Artikel “Transfer Pembelajaran Melampaui Model Standar” oleh Veena Krishnaraj, Adrian E. Bayer, Christian Kragh Jespersen, dan Peter Melchior kini tersedia di JSTAT.