MindSpore Huawei: Pesaing Baru Untuk TensorFlow Dan PyTorch?

2025 Pengarang: Timothy Dodson | [email protected]. Terakhir diubah: 2025-01-22 21:32

Huawei mengumumkan bahwa middleware MindSpore Deep Learning gaya TensorFlow dan PyTorch sekarang menjadi open source. Cari tahu di artikel ini karakteristiknya yang paling penting.

Huawei baru saja mengumumkan bahwa kerangka kerja MindSpore untuk mengembangkan aplikasi AI menjadi open source dan tersedia di GiHub dan Gitee. MindSpore adalah kerangka kerja Deep Learning lainnya untuk melatih model jaringan saraf, mirip dengan TensorFlow atau PyTorch, dirancang untuk digunakan dari Edge ke Cloud, yang mendukung GPU dan jelas prosesor Huawei Ascend.

Agustus lalu, ketika Huawei mengumumkan peluncuran resmi prosesor Ascend-nya, MindSpore pertama kali diperkenalkan, yang menyatakan bahwa “dalam sesi pelatihan berbasis ResNet-50, kombinasi Ascend 910 dan MindSpore sekitar dua kali lebih cepat. Saat melatih model AI versus kartu pembelajaran utama lainnya menggunakan TensorFlow Memang benar bahwa banyak kerangka kerja telah muncul dalam beberapa tahun terakhir, dan mungkin MindSpore tidak lebih dari satu grup yang bahkan dapat bersaing dari jarak jauh dengan TensorFlow (didukung oleh Google) dan PyTorch (didukung oleh Facebook).

Sistem arsitektur

Situs web MindSpore menjelaskan bahwa infrastruktur terdiri dari tiga lapisan utama: ekspresi frontend, mesin grafis, dan runtime backend. Gambar berikut menunjukkan diagram visual:

Tingkat pertama MindSpore menawarkan API Python untuk programmer. Karena linguistik bahasa di komunitas kami adalah Python de facto, dan jika tidak, MindSpore ingin bersaing dengan PyTorch dan TensorFlow. Dengan API ini, programmer dapat memanipulasi model (pelatihan, inferensi, dll.) dan memproses data. Tingkat pertama ini juga mencakup dukungan untuk representasi interim kode (MindSpore IR), di mana banyak pengoptimalan akan didasarkan yang dapat dilakukan dalam paralelisasi dan diferensiasi otomatis (GHLO).

Di bawah ini adalah lapisan Graph Engine yang menyediakan fungsionalitas yang diperlukan untuk membuat dan menjalankan diferensiasi otomatis dari grafik eksekusi. Dengan MindSpore, mereka memilih model diferensiasi otomatis selain PyTorch (yang menghasilkan grafik eksekusi dinamis) atau TensorFlow (meskipun opsi untuk membuat jadwal eksekusi statis yang lebih efisien awalnya dipilih, sekarang juga menawarkan opsi grafik eksekusi dinamis dan memungkinkan versi statis grafik dengan menggunakan dekorator @ tf.function dari API tingkat rendahnya).

Pilihan MindSpore adalah mengubah kode sumber ke format kode perantara (MindSpore IR) untuk memanfaatkan kedua model (untuk informasi lebih lanjut, lihat bagian "Pemisahan Otomatis" di situs web MindSpore).

Lapisan terakhir terdiri dari semua perpustakaan dan lingkungan runtime yang diperlukan untuk mendukung berbagai arsitektur perangkat keras di mana kode akan diproses. Kemungkinan besar, itu akan menjadi backend yang sangat mirip dengan kerangka kerja lain, mungkin dengan fitur Huawei, seperti perpustakaan seperti HCCL (Huawei Collective Communication Library), setara dengan NVIDIA NCCL (NVIDIA Collective Communication Library).

Dukungan visualisasi pelatihan

Menurut tutorial MindSpore, meskipun tidak mungkin untuk menginstal dan menggunakannya, mereka memiliki MindInsight untuk membuat visualisasi yang agak mengingatkan pada TensorBoard, TensorFlow. Lihatlah beberapa tangkapan layar yang mereka tampilkan di situs web mereka:

Menurut manual, MindSpore saat ini menggunakan mekanisme panggilan balik (mengingatkan bagaimana hal itu dilakukan dengan Keras) untuk menulis (dalam file log) dalam proses pelatihan semua parameter model dan hyperparameter yang kita inginkan, serta jadwal komputasi saat kompilasi jaringan saraf menjadi kode perantara selesai.

Paralelisme

Dalam tutorial mereka, mereka berbicara tentang dua mode paralelisasi (DATA_PARALLEL dan AUTO_PARALLEL) dan memberikan kode contoh yang melatih ResNet-50 dengan kumpulan data CIFAR untuk prosesor Ascend 910 (yang tidak dapat saya uji). DATA_PARALLEL mengacu pada strategi yang umumnya dikenal sebagai paralelisme data, yang terdiri dari membagi data pelatihan menjadi beberapa subset, yang masing-masing berjalan pada replika model yang sama, tetapi dalam unit pemrosesan yang berbeda. Dukungan Graph Engine disediakan untuk paralelisasi kode dan khususnya untuk paralelisme AUTO_PARALLEL.

Mode AUTO_PARALLEL secara otomatis mengoptimalkan paralelisasi dengan menggabungkan strategi paralelisasi data (dibahas di atas) dengan strategi paralelisasi model, di mana model dibagi menjadi beberapa bagian yang berbeda, dan setiap bagian dieksekusi secara paralel di unit pemrosesan yang berbeda. Mode otomatis ini memilih strategi paralelisasi yang menawarkan manfaat terbaik, yang dapat dibaca di bagian Paralel Otomatis di situs web MindSpore (walaupun tidak menjelaskan bagaimana perkiraan dan keputusan dibuat). Kami harus menunggu untuk menyediakan waktu bagi tim teknis untuk memperluas dokumentasi dan memahami lebih banyak detail tentang strategi paralelisasi otomatis. Tetapi jelas bahwa strategi paralelisasi otomatis ini sangat penting, dan di sinilah mereka harus dan dapat bersaing dengan TensorFlow atau PyTorch, mendapatkan kinerja yang jauh lebih baik menggunakan prosesor Huawei.

Peta jalan yang direncanakan dan cara berkontribusi

Jelas ada banyak pekerjaan yang harus dilakukan dan pada titik ini mereka telah merampingkan ide-ide yang ada dalam pikiran mereka untuk tahun depan dalam peta jalan ekstensif yang disajikan di halaman ini, tetapi mereka berpendapat bahwa prioritas akan disesuaikan menurut pengguna.

Masukan. Saat ini kita dapat menemukan jalur utama ini:

Dukungan untuk lebih banyak model (model klasik tertunda, GAN, RNN, Transformers, model pembelajaran yang diperkuat, pemrograman probabilistik, AutoML, dll.).
Perluas API dan library untuk meningkatkan kegunaan dan pengalaman pemrograman (lebih banyak operator, lebih banyak pengoptimal, lebih banyak fungsi loss, dll.)
Dukungan prosesor Huawei Ascend yang komprehensif dan optimalisasi kinerja (optimasi kompilasi, peningkatan pemanfaatan sumber daya, dll.)
Evolusi tumpukan perangkat lunak dan eksekusi pengoptimalan grafik komputasi (meningkatkan representasi IR menengah, menambahkan kemampuan pengoptimalan tambahan, dll.).
Dukungan untuk lebih banyak bahasa pemrograman (bukan hanya Python).
Peningkatan pembelajaran terdistribusi dengan optimalisasi penjadwalan otomatis, distribusi data, dll.
Tingkatkan alat MindInsight untuk memudahkan programmer "men-debug" dan meningkatkan penyetelan hyperparameter selama proses pembelajaran.
Kemajuan dalam memberikan fungsionalitas inferensi ke perangkat di Edge (keamanan, dukungan untuk model non-platform melalui ONNX, dll.)

Di halaman komunitas, Anda dapat melihat bahwa MindSpore memiliki mitra di luar Huawei dan China, seperti University of Edinburgh, Imperial College London, University of Munster (Jerman) atau Universitas Paris-Saclay. Mereka mengatakan bahwa mereka akan mengikuti model tata kelola terbuka dan mengundang seluruh komunitas untuk berkontribusi pada kode dan dokumentasi.

Kesimpulan

Setelah melihat sekilas, sepertinya keputusan desain dan implementasi yang tepat (seperti konkurensi dan diferensiasi otomatis) dapat menambahkan ruang untuk peningkatan dan pengoptimalan yang mencapai kinerja yang lebih baik daripada kerangka kerja yang ingin mereka unggulkan. Namun masih banyak pekerjaan di depan untuk mengejar PyTorch dan TensorFlow, dan yang terpenting adalah membangun komunitas, bukan hanya! Namun, kita semua sudah tahu bahwa dengan dukungan satu perusahaan besar di sektor seperti Huawei, segala sesuatu mungkin terjadi, atau sudah jelas tiga tahun lalu ketika versi pertama PyTorch (Facebook) keluar bahwa itu bisa saja hampir habis. dari TensorFlow (Google)?

Direkomendasikan:

Apa Yang Baru Untuk IPad Mini

Penggemar produk Apple sangat menantikan musim gugur: pada bulan September-Oktober beberapa perangkat baru direncanakan akan diluncurkan di pasar, termasuk iPad mini, versi tablet iPad yang lebih kecil yang telah memenangkan hati jutaan pengguna

Cara Membuat Gambar Untuk Selamat Tahun Baru

Sangat menyenangkan menerima ucapan selamat, mengetahui bahwa penulis telah menghabiskan waktu dan tenaganya untuk mendesainnya. Dan tidak masalah apakah Anda memberi selamat kepada orang yang dicintai atau kolega. Karena itu, gambar "Selamat Tahun Baru"

Akankah Kamera Facebook Menjadi Pesaing Serius Instagram?

Rilis aplikasi Kamera Facebook mengejutkan sebagian besar pengulas, karena jejaring sosial baru-baru ini mengakuisisi Instagram, salah satu layanan web berbagi foto paling populer di dunia, seharga $ 1 miliar. Pertama-tama, perlu dicatat bahwa Facebook Camera adalah versi 1

Bagaimana Versi Baru OS Untuk Mac Berbeda Dari Yang Lama

OS X 10.8 Mountain Lion adalah versi baru dari sistem operasi untuk komputer Macintosh yang dirilis pada 25 Juli 2012. Dibandingkan dengan versi sebelumnya, ia memiliki lebih dari 200 fitur baru. Selain itu, Apple, mulai dengan versi ini, akan memperbarui OS-nya setiap tahun, sedangkan sebelumnya melakukannya setiap 2 tahun

MacBook Baru: Pro Dan Kontra

Peluncuran setiap model laptop baru dari Apple merupakan peristiwa penting. Mengapa? Tidak peduli bagaimana orang berpikir tentang teknologi perusahaan, tetapi seringkali produk barunya yang mengatur nada di industri selama beberapa tahun. Dalam artikel ini, kami telah memberikan daftar singkat poin-poin penting di MacBook baru, mencoba menghindari pujian yang tidak perlu dan hal negatif yang tidak perlu

MindSpore Huawei: Pesaing Baru Untuk TensorFlow Dan PyTorch?

Daftar Isi:

Sistem arsitektur

Dukungan visualisasi pelatihan

Paralelisme

Peta jalan yang direncanakan dan cara berkontribusi

Kesimpulan

Direkomendasikan:

Apa Yang Baru Untuk IPad Mini

Cara Membuat Gambar Untuk Selamat Tahun Baru

Akankah Kamera Facebook Menjadi Pesaing Serius Instagram?

Bagaimana Versi Baru OS Untuk Mac Berbeda Dari Yang Lama

MacBook Baru: Pro Dan Kontra

Bagaimana Menerjemahkan Dari Bahasa Inggris Ke Bahasa Rusia Windows

Cara Memutar Kembali Sistem Melalui BIOS

Cara Mengaktifkan Dhcp Pada Adaptor Jaringan

Cara Mengetahui Id Komputer

Cara Mentransfer File Dari Komputer Ke Komputer Melalui Wifi

Bagaimana Mengkonversi Avi Ke Mp4 Dengan Cepat

Bagaimana Mengkonversi Mp4 Ke Avi Online

Cara Mengatur Ulang Pabrik IPhone 5s

Bagaimana Mengkonversi Mkv Ke Mp4 Online

Bagaimana Menerjemahkan Excel Ke Pdf

Cara Menghapus Seluruh Riwayat Penelusuran

Cara Memasang Disk Virtual

Mengubah Satuan Pengukuran Di Adobe Illustrator

Bagaimana Menyelaraskan Cakrawala Di Photoshop

Cara Memasang Penggaris Di Desktop Anda