AI Generatif DataCebo dari MIT menguji software data sintetis — GONews Digital
GONews.Digital — AI Generatif DataCebo mendapat banyak perhatian karena kemampuannya untuk menciptakan teks dan gambar. Namun, media-media tersebut hanya mewakili sebagian kecil dari data yang berkembang di masyarakat kita saat ini. Data dihasilkan setiap kali seorang pasien melewati sistem medis, badai memengaruhi penerbangan, atau seseorang berinteraksi dengan aplikasi perangkat lunak.
Pemanfaatan AI Generatif DataCebo untuk menciptakan data sintetis yang realistis seputar skenario-skenario tersebut dapat membantu organisasi dalam menangani pasien dengan lebih efektif, mengalihkan rute pesawat, atau meningkatkan platform perangkat lunak — terutama dalam skenario-skenario di mana data dunia nyata terbatas atau sensitif.
Selama tiga tahun terakhir, DataCebo, spinout MIT, telah menawarkan sistem perangkat lunak AI Generatif DataCebo bernama Synthetic Data Vault untuk membantu organisasi menciptakan data sintetis untuk melakukan hal-hal seperti menguji aplikasi perangkat lunak dan melatih model pembelajaran mesin.
SDV telah diunduh lebih dari 1 juta kali, dengan lebih dari 10.000 ilmuwan data menggunakan perpustakaan open-source untuk menghasilkan data tabular sintetis. Para pendiri — Principal Research Scientist Kalyan Veeramachaneni dan alumna Neha Patki ’15, SM ‘16 — percaya bahwa kesuksesan perusahaan ini disebabkan oleh kemampuan SDV untuk merevolusi pengujian perangkat lunak AI Generatif DataCebo.
Pada tahun 2016, kelompok Veeramachaneni di Data to AI Lab mengungkapkan serangkaian alat AI Generatif DataCebo open-source untuk membantu organisasi menciptakan data sintetis yang sesuai dengan properti statistik dari data nyata.
Perusahaan dapat menggunakan data sintetis sebagai pengganti informasi sensitif dalam program sambil tetap mempertahankan hubungan statistik antara titik data. Perusahaan juga dapat menggunakan data sintetis untuk menjalankan perangkat lunak baru melalui simulasi untuk melihat seberapa baik kinerjanya sebelum dirilis ke publik.
Kelompok Veeramachaneni menghadapi masalah karena bekerja dengan perusahaan-perusahaan yang ingin berbagi data mereka untuk riset.
“MIT membantu Anda melihat semua kasus penggunaan yang berbeda ini,” jelas Patki. “Anda bekerja dengan perusahaan keuangan dan perusahaan perawatan kesehatan, dan semua proyek tersebut berguna untuk merumuskan solusi lintas industri.”
Pada tahun 2020, para peneliti mendirikan DataCebo untuk membangun fitur SDV lebih lanjut untuk organisasi yang lebih besar. Sejak itu, kasus penggunaan AI Generatif DataCebo telah seimpressif dan beragam.
Dengan simulator penerbangan baru dari DataCebo, maskapai penerbangan dapat merencanakan untuk kejadian cuaca langka dengan cara yang tidak mungkin dilakukan hanya dengan menggunakan data historis. Pada aplikasi lain, pengguna SDV mensintesis catatan medis untuk memprediksi hasil kesehatan pasien dengan fibrosis kistik. Sebuah tim dari Norwegia baru-baru ini menggunakan SDV untuk membuat data siswa sintetis guna mengevaluasi apakah berbagai kebijakan penerimaan bersifat meritokratis dan bebas dari bias.
Pada tahun 2021, platform sains data Kaggle menyelenggarakan kompetisi bagi ilmuwan data yang menggunakan SDV untuk membuat kumpulan data sintetis guna menghindari penggunaan data propietary. Sekitar 30.000 ilmuwan data berpartisipasi, membangun solusi dan memprediksi hasil berdasarkan data realistis perusahaan.
Dan seiring dengan perkembangan AI Generatif DataCebo, perusahaan tetap setia pada akar MIT-nya: Seluruh karyawan saat ini adalah alumni MIT.
Meningkatkan kecepatan pengujian software AI Generatif DataCebo
Meskipun AI Generatif DataCebo alat open-source mereka digunakan untuk berbagai kasus penggunaan, perusahaan ini berfokus pada peningkatan daya tariknya dalam pengujian perangkat lunak.
“Untuk menguji aplikasi perangkat lunak ini, Anda membutuhkan data,” kata Veeramachaneni. “Secara tradisional, pengembang secara manual menulis skrip untuk membuat data sintetis. Dengan model generatif yang dibuat menggunakan SDV, Anda dapat belajar dari sampel data yang dikumpulkan dan kemudian mengambil sampel volume data sintetis yang besar (yang memiliki properti yang sama dengan data nyata), atau membuat skenario khusus dan kasus-kasus ujung, dan menggunakan data tersebut untuk menguji aplikasi Anda.”
Misalnya, jika sebuah bank ingin menguji program yang dirancang untuk menolak transfer dari rekening yang tidak memiliki uang, maka bank tersebut harus mensimulasikan banyak rekening yang melakukan transaksi secara bersamaan. Melakukan hal tersebut dengan data yang dibuat secara manual akan memakan banyak waktu. Dengan model AI Generatif DataCebo, pelanggan dapat membuat kasus ujung apa pun yang mereka inginkan untuk diuji.
“Umum bagi industri memiliki data yang sensitif dalam beberapa kapasitas,” kata Patki. “Seringkali ketika Anda berada dalam domain dengan data sensitif, Anda berurusan dengan regulasi, dan bahkan jika tidak ada regulasi hukum, adalah kepentingan terbaik perusahaan untuk berhati-hati tentang siapa yang mendapatkan akses ke apa pada waktu tertentu. Jadi, data sintetis selalu lebih baik dari perspektif privasi.”
AI Generatif DataCebo Sebagai Scalling Data Sintetis
Veeramachaneni meyakini bahwa AI Generatif DataCebo sedang memajukan bidang yang disebutnya sebagai data perusahaan sintetis, atau data yang dihasilkan dari perilaku pengguna pada aplikasi perangkat lunak perusahaan besar.
“Data perusahaan semacam ini kompleks, dan tidak ada ketersediaan universal untuknya, berbeda dengan data bahasa,” kata Veeramachaneni. “Ketika orang menggunakan perangkat lunak kami yang tersedia secara publik dan melaporkan apakah berhasil pada pola tertentu, kami belajar banyak dari pola-pola unik ini, dan AI Generatif DataCebo ini memungkinkan kami untuk meningkatkan algoritma kami. Dari satu sudut pandang, kami sedang membangun korpus dari pola-pola kompleks ini, yang untuk bahasa dan gambar sudah tersedia dengan mudah.”
DataCebo juga baru-baru ini merilis fitur-fitur untuk meningkatkan kegunaan SDV, termasuk alat-alat untuk menilai “realisme” data yang dihasilkan, yang disebut perpustakaan SDMetrics serta cara untuk membandingkan performa model yang disebut SDGym.
“Ini tentang memastikan organisasi mempercayai data baru ini,” kata Veeramachaneni. “ data sintetis yang dapat diprogram, yang berarti kami memungkinkan perusahaan untuk menyisipkan wawasan dan intuisi khusus mereka untuk membangun model yang lebih transparan.”.
DataCebo membantu perusahaan di berbagai industri untuk mengadopsi kecerdasan buatan dan alat ilmu data lainnya dengan cara yang lebih transparan dan bertanggung jawab.
Menurut Veeramachaneni, dalam beberapa tahun mendatang, data sintetis dari model AI Generatif DataCebo akan mengubah semua pekerjaan data. Kami percaya bahwa 90% operasi perusahaan dapat dilakukan dengan data sintetis.
Tren dan Peluang Masa Depan dari AI Generatif DataCebo.
Teknologi AI generatif adalah bidang yang berkembang pesat dengan potensi untuk merevolusi pengujian perangkat lunak otomatis. Dengan mengotomatisasi pembuatan kasus uji, AI generatif DataCebo dapat membantu para pengujian untuk menghemat waktu dan usaha, serta meningkatkan kualitas ujiannya.
Ke depannya, AI generatif DataCebo kemungkinan besar akan digunakan untuk mengotomatisasi berbagai tugas pengujian perangkat lunak, termasuk:
— Pembangkitan kasus uji: AI generatif DataCebo dapat digunakan untuk menghasilkan kasus uji yang disesuaikan dengan aplikasi perangkat lunak tertentu. Hal ini dapat membantu memastikan bahwa uji coba komprehensif dan mencakup semua area potensial kegagalan.
— Pengujian eksploratif: Kecerdasan Buatan Generatif dapat digunakan untuk mengotomatisasi pengujian eksploratif, yang merupakan teknik pengujian perangkat lunak dengan cara menjelajahinya secara bebas. Hal ini dapat membantu mengidentifikasi bug yang tidak terduga dan tidak terdokumentasi.
— Pengujian visual: Kecerdasan Buatan Generatif dapat digunakan untuk mengotomatisasi pengujian visual, yang merupakan teknik untuk menguji tampilan perangkat lunak. Hal ini dapat membantu memastikan bahwa perangkat lunak terlihat benar dan memenuhi semua persyaratan desain.
Selain tugas-tugas khusus ini, Artificial intelligence generatif juga kemungkinan besar akan digunakan untuk meningkatkan efisiensi dan efektivitas pengujian perangkat lunak otomatis secara umum. Sebagai contoh, AI generatif DataCebo dapat digunakan untuk:
— Identifikasi dan prioritaskan kasus uji: Kecerdasan Buatan Generatif dapat digunakan untuk mengidentifikasi kasus uji yang paling mungkin menemukan bug. Hal ini dapat membantu untuk memfokuskan upaya pengujian pada area-area yang paling kritis.
— Automatisasi pemeliharaan uji: Kecerdasan Buatan Generatif dapat digunakan untuk mengotomatisasi pemeliharaan kasus uji. Hal ini dapat membantu untuk memastikan bahwa uji tetap terjaga kekinian saat perangkat lunak berubah.
Perkembangan AI generatif DataCebo dalam pengujian perangkat lunak otomatis sangat menjanjikan. Seiring dengan evolusi generative AI, kemungkinan akan menjadi lebih kuat dan serbaguna. Hal ini akan membuka peluang baru untuk mengotomatisasi pengujian perangkat lunak dan untuk meningkatkan kualitas perangkat lunak.