Home Teknologi Tim Qwen Alibaba merilis model AI yang dapat mengontrol PC dan telepon

Tim Qwen Alibaba merilis model AI yang dapat mengontrol PC dan telepon

19
0
Tim Qwen Alibaba merilis model AI yang dapat mengontrol PC dan telepon


China AI Lab Deepseek mungkin mendapatkan sebagian besar perhatian industri teknologi minggu ini. Tapi salah satu saingan domestik topnya, Alibaba, tidak duduk diam.

Tim Qwen Alibaba pada hari Senin dilepaskan Keluarga baru model AI, qwen2.5-vl, yang dapat melakukan sejumlah tugas analisis teks dan gambar. Model dapat menguraikan file, memahami video, dan menghitung objek dalam gambar, serta mengontrol PC – mirip dengan model yang memberi daya pada operator yang baru diluncurkan Openai.

Per tolok ukur tim Qwen, model Qwen2.5-VL terbaik mengalahkan Openai's GPT-4O, Claude 3.5 soneta Anthropic, dan Flash Google Gemini 2.0 pada berbagai pemahaman video, matematika, analisis dokumen, dan evaluasi pertanyaan.

Kredit gambar:Alibaba

Qwen2.5-vl, yang tersedia untuk diuji di Alibaba Obrolan qwen aplikasi dan ke unduh Dari platform AI dev memeluk wajah, dapat menganalisis grafik dan grafik, mengekstrak data dari pemindaian faktur dan formulir, dan “memahami” video bertingkat beberapa jam, kata tim Qwen. Qwen2.5-VL juga dapat mengenali “IPS dari film dan serial TV, serta berbagai macam produk,” per tim – Menyarankan bahwa model mungkin telah dilatih sebagian pada karya berhak cipta.

Qwen2.5-VL, menjadi AI yang dikembangkan oleh perusahaan Cina, memiliki batasan tertentu pada topik yang akan dibahas-setidaknya dalam obrolan Qwen. Ketika saya bertanya kepada model QWEN2.5-VL terbesar dan paling cakap, Qwen2.5-VL-72B, untuk berbicara tentang “kesalahan Xi Jinping,” Qwen Obrolan melemparkan pesan kesalahan.

Regulator Internet China tolok ukur Banyak model yang dikembangkan di negara ini untuk memastikan tanggapan mereka “mewujudkan nilai -nilai sosialis inti.” Banyak Sistem AI Cina menurun untuk menanggapi topik yang mungkin meningkatkan kemarahan regulator, seperti otonomi Taiwan.

Salah satu fitur QWEN2.5-VL yang lebih menarik adalah kemampuannya untuk berinteraksi dengan perangkat lunak-baik pada PC dan perangkat seluler. Sebuah video yang diposting di X oleh Philipp Schmid, pemimpin teknis di Hugging Face, Qwen2.5-VL meluncurkan aplikasi Booking.com untuk Android dan memesan penerbangan dari Chongqing ke Beijing.

Dalam video di bawah ini, model QWEN2.5-VL mengontrol aplikasi pada desktop Linux-tetapi tampaknya tidak mencapai banyak di luar tab switching. Mungkin secara tidak tepat, pembandingan Qwen menunjukkan skor Qwen2.5-VL dengan buruk di Osworld, sebuah tolok ukur yang mencoba meniru lingkungan komputer yang nyata.

Dua model yang lebih kecil dan kurang canggih dalam seri QWEN2.5-VL, QWEN2.5-VL-3B dan QWEN2.5-VL-7B, tersedia di bawah lisensi permisif. Namun, unggulan QWEN2.5-VL-72B berada di bawah lisensi khusus Alibaba, yang mengharuskan perusahaan dan devs dengan lebih dari 100 juta pengguna aktif bulanan meminta izin dari QWEN/ALIBABA sebelum menggunakan model secara komersial.




LEAVE A REPLY

Please enter your comment!
Please enter your name here