Google เดินหน้าเต็มสูบในสนามประลองปัญญาประดิษฐ์ (AI) เปิดตัว Gemini 1.5 โมเดลใหม่ล่าสุดเพียงสัปดาห์เดียวหลังจาก Gemini 1.0 ประสบความสำเร็จ โมเดลใหม่นี้มาพร้อมประสิทธิภาพที่เหนือกว่า และความสามารถล้ำสมัยในการประมวลผลข้อมูลบริบทได้มากถึงหนึ่งล้านโทเค็น
Gemini 1.5 คืออะไร?
Gemini 1.5 เป็นโมเดล AI แบบมัลติโมดัล (multimodal AI) ล่าสุดจาก Google หมายความว่ามันสามารถประมวลผลและสร้างเนื้อหาได้หลากหลายรูปแบบ เช่น ข้อความ รูปภาพ เสียง วิดีโอ และโค้ด ความสามารถนี้ทำให้ Google ก้าวล้ำหน้า ChatGPT ของ OpenAI เพราะผู้ใช้สามารถป้อนข้อมูลได้ละเอียดและซับซ้อนมากขึ้น ช่วยให้ได้ผลลัพธ์ที่แม่นยำและตรงประเด็น
Gemini 1.5 เปิดตัวเมื่อวันที่ 16 กุมภาพันธ์ 2567
ปัจจุบัน อยู่ในช่วงทดสอบและเปิดให้ใช้งานแบบจำกัดสำหรับนักพัฒนาและลูกค้าองค์กรผ่าน Google AI Studio และ Vertex AI เร็วๆ นี้ Google จะประกาศราคาเริ่มต้นและขยายการรองรับให้สามารถประมวลผลโทเค็นได้สูงสุด 1 ล้านโทเค็น
Gemini ปะทะ Sora ของ OpenAI
การเปิดตัว Gemini 1.5 นั้นสอดคล้องกับจังหวะที่ OpenAI เปิดตัว Sora โมเดล AI แปลงข้อความเป็นวิดีโอ ผู้เชี่ยวชาญมองว่าแม้ Sora จะมีศักยภาพน่าสนใจ แต่ยังอยู่ในช่วงเริ่มต้นของการพัฒนา กลยุทธ์ของ Google ดูจะมุ่งเน้นไปที่การสร้างโมเดล AI แบบมัลติโมดัลที่หลากหลายและพร้อมใช้งานจริง
จุดเด่นของ Gemini 1.5
- เข้าใจบริบทยาว: โมเดล Gemini 1.5 โดดเด่นด้วยความสามารถพิเศษในการประมวลผลข้อมูลบริบทได้มากถึงหนึ่งล้านโทเค็น ช่วยให้เข้าใจสถานการณ์และตอบสนองได้ลึกซึ้งและแม่นยำ
- ประสิทธิภาพ: แม้จะทรงพลัง แต่ Gemini 1.5 Pro ได้รับการออกแบบให้ประหยัดพลังงาน ใช้ทรัพยากรในการประมวลผลน้อยกว่าโมเดลอื่นที่มีขนาดใกล้เคียงกัน
- มัลติโมดัล: Google กำลังเป็นผู้นำในอุตสาหกรรมด้วยโมเดลภาษาขนาดใหญ่แบบมัลติโมดัลดั้งเดิม (native multimodal LLMs) กลยุทธ์นี้ช่วยขจัดความจำเป็นในการผสานโมเดลหลายตัวเข้าด้วยกัน เพิ่มประสิทธิภาพและความแม่นยำ
ผู้ใช้งานกลุ่มแรกและการแข่งขันโมเดล AI แบบมัลติโมดัล
นักวิเคราะห์คาดการณ์ว่าอุตสาหกรรมสื่อและบันเทิงจะใช้งานโมเดล AI แบบมัลติโมดัลอย่าง Gemini 1.5 อย่างแพร่หลายเพื่อพัฒนาการผลิตเนื้อหา บริษัทที่มุ่งเน้นด้านการตลาดและการออกแบบก็มองหาวิธีใช้โมเดลเหล่านี้เพื่อเพิ่มประสิทธิภาพกระบวนการสร้างสรรค์
OpenAI เร่งพัฒนา GPT-5
การแข่งขันในสนามประลอง AI แบบมัลติโมดัลทวีความรุนแรงขึ้น OpenAI กำลังเร่งพัฒนา GPT-5 โมเดลใหม่นี้คาดว่าจะมีความสามารถแบบมัลติโมดัลด้วย แต่ผู้เชี่ยวชาญชี้ว่า GPT-5 ไม่ได้เป็นโมเดลแบบมัลติโมดัลดั้งเดิม อาจส่งผลต่อประสิทธิภาพในระยะยาว
เปิดโอกาสให้นักพัฒนา
Google เปิดตัวตัวอย่างส่วนตัวของ Gemini 1.5 Pro นำเสนอเครื่องมืออันทรงพลังให้นักพัฒนาภายใน Google AI Studio สตูดิโอนี้ช่วยให้นักพัฒนาเข้าถึงโมเดล AI หลากหลาย พร้อม API ที่ใช้งานง่ายสำหรับผสานรวมกับแอปพลิเคชันใหม่
สรุป
กลยุทธ์ที่รุกแรงของ Google กำลังขับเคลื่อนการเปลี่ยนแปลงครั้งใหญ่ในโลกของ AI โมเดล Gemini 1.5 สะท้อนให้เห็นถึงความทุ่มเทในการสร้างโมเดล AI แบบมัลติโมดัลที่ใช้งานจริงและเข้าถึงได้สำหรับนักพัฒนาทั่วโลก ยังต้องติดตามกันต่อไปว่า OpenAI และผู้เล่นรายอื่นจะตอบโต้แรงกดดันจากคู่แข่งอย่างไร
ติดตามข่าวสารล่าสุดได้ที่
https://www.siambitcoin.com/