TiTok AI วิธีการบีบอัดรูปภาพบนเชนที่มีประสิทธิภาพใหม่ อาจเป็นเครื่องมือที่มีประโยชน์สำหรับแอปพลิเคชันบล็อกเชน
Vitalik Buterin ผู้ร่วมก่อตั้ง Ethereum ได้แสดงการสนับสนุนต่อโทเคนใหม่ Token for Image Tokenizer (TiTok) ซึ่งเป็นวิธีการบีบอัดรูปภาพใหม่ที่มีประสิทธิภาพสูง เหมาะสำหรับการใช้งานบนบล็อกเชน
อย่าสับสนกับแพลตฟอร์มโซเชียลมีเดีย TikTok เทคโนโลยีบีบอัดรูปภาพใหม่ล่าสุดที่ชื่อ TiTok จะช่วยลดขนาดไฟล์รูปภาพได้อย่างมีนัยสำคัญ เหมาะอย่างยิ่งสำหรับการจัดเก็บบนบล็อกเชน
Buterin ได้เน้นย้ำถึงศักยภาพของ TikTok บนบล็อกเชน ผ่านแพลตฟอร์มโซเชียลมีเดียแบบกระจายศูนย์ Farcaster โดยระบุว่า “320 บิต นั้นเล็กพอที่จะจัดเก็บบนบล็อกเชนได้สำหรับผู้ใช้ทุกคน”
การพัฒนาใหม่นี้ อาจส่งผลต่อการจัดเก็บรูปภาพดิจิทัลของรูปโปรไฟล์ (PFPs) และโทเคน NFT บนบล็อกเชน
ที่มา : Thomas
TiTok เป็นเทคโนโลยีบีบอัดรูปภาพแบบใหม่
เทคโนโลยี TiTok พัฒนาโดยนักวิจัยจาก ByteDance และ Technical University Munich ช่วยให้บีบอัดรูปภาพเป็นชิ้นข้อมูลขนาดเล็ก (bits) เพียง 32 ชิ้น โดยไม่สูญเสียคุณภาพ
จากเอกสารวิจัยของ TiTok นั้น การบีบอัดรูปภาพด้วยปัญญาประดิษฐ์ (AI) ล้ำสมัย ช่วยให้ TiTok สามารถบีบอัดรูปภาพขนาด 256×256 พิกเซล ลงเหลือเพียง “โทเคนแยก 32 ตัว (discrete tokens)”
TiTok เป็นเทคนิคการแปลงภาพแบบ 1 มิติ (1D) ที่ “ทำลายข้อจำกัดของกริดที่มีอยู่ในวิธีการแปลงภาพแบบ 2D” ช่วยให้ได้ภาพที่มีความยืดหยุ่นและขนาดกะทัดรัดยิ่งขึ้น
“ผลลัพธ์คือ การเพิ่มความเร็วในการสุ่มตัวอย่างอย่างมีนัยสำคัญ (ตัวอย่างเช่น เร็วกว่า DiT-XL/2 ถึง 410 เท่า) โดยยังคงรักษาคุณภาพการสร้างภาพที่แข่งขันได้”
เอกสารวิจัย TiTok เปรียบเทียบขนาดการบีบอัดรูปภาพ ที่มา: TiTok
Machine learning imagery
TikTok ใช้การเรียนรู้ของเครื่อง (machine learning) และ AI ขั้นสูง ผ่านโมเดล Transformer เพื่อแปลงรูปภาพเป็นตัวแทนแบบโทเคน (tokenized representations)
วิธีการนี้ใช้ region redundancy ซึ่งหมายความว่ามันระบุและใช้ข้อมูลซ้ำซ้อนใน region ต่างๆ ของภาพเพื่อลดขนาดข้อมูลโดยรวมของผลิตภัณฑ์ขั้นสุดท้าย
ความก้าวหน้าล่าสุดของ generative model ตอกย้ำบทบาทสำคัญของการแปลงภาพเป็นโทเค็น สำหรับการสร้างภาพความละเอียดสูงอย่างมีประสิทธิภาพ
งานวิจัยระบุว่า “การแทนค่าแบบแฝงที่กระชับ” ของ TiTok นำเสนอ “การแทนค่าที่มีประสิทธิภาพและมีประสิทธิผลมากกว่าเทคนิคทั่วไป”
ภาพรวมการประมวลผลภาพ (a) and generation (b) with the TiTok framework (c). ที่มา : TiTok
TiTok ไม่ใช่ TikTok
แม้จะมีชื่อคล้ายกัน แต่ TikTok แพลตฟอร์มโซเชียลมีเดียไม่ได้รับการสนับสนุนจาก Buterin
ผู้ร่วมก่อตั้ง Ethereum เน้นย้ำถึงศักยภาพของ TiTok AI บนบล็อกเชน ช่วยเพิ่มความน่าเชื่อถือให้กับวิธีการบีบอัดรูปภาพใหม่ด้วย AI
ต่างจากโมเดล VQ 2 มิติทั่วไปที่พิจารณาพื้นที่แฝงของภาพเป็นตาราง 2 มิติ เราเสนอวิธีการแปลงภาพเป็นลำดับแฝง 1 มิติที่มีประสิทธิภาพมากขึ้น
วิธีการใหม่ที่เสนอสามารถ “แทนภาพด้วยโทเคนน้อยลง” 8 ถึง 64 เท่า เมื่อเทียบกับ “โทเคนไนซ์ 2 มิติ” ทีมวิจัยคาดหวังว่า งานวิจัยนี้จะช่วยนำไปสู่ “การแทนภาพที่มีประสิทธิภาพมากขึ้น”
ที่มา : cointelegraph.com