TurboQuant บีบอัดหน่วยความจำ KV cache ของ AI ได้สูงสุดถึงห้าเท่า โดยมีผลกระทบต่อคุณภาพของโมเดลน้อยมาก การอัปเกรดนี้ช่วยให้แล็ปท็อปและโทรศัพท์สามารถรัน AI ได้นานขึ้นTurboQuant บีบอัดหน่วยความจำ KV cache ของ AI ได้สูงสุดถึงห้าเท่า โดยมีผลกระทบต่อคุณภาพของโมเดลน้อยมาก การอัปเกรดนี้ช่วยให้แล็ปท็อปและโทรศัพท์สามารถรัน AI ได้นานขึ้น

Tether นำ TurboQuant ของ Google มาใช้งานจริง ปลดล็อก AI บริบทยาวบนอุปกรณ์ทั่วไป

2026/06/02 07:46
2 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ [email protected]

TLDR:

  • TurboQuant บีบอัดหน่วยความจำ KV cache ของ AI ได้สูงสุดถึงห้าเท่า โดยกระทบต่อคุณภาพของโมเดลน้อยมาก
  • การอัปเกรดนี้ช่วยให้แล็ปท็อปและโทรศัพท์สามารถรัน AI session ได้นานขึ้นโดยไม่ต้องพึ่งพาคลาวด์
  • QVAC SDK 0.12.0 รวม TurboQuant เข้ากับ Fabric ขยายตัวเลือกการพัฒนา AI ในเครื่อง
  • Tether มุ่งพัฒนา AI ที่เน้นความเป็นส่วนตัว โดยนำการ inference ที่มีประสิทธิภาพเข้าใกล้ผู้ใช้ปลายทางมากขึ้น

กลุ่มวิจัย AI ของ Tether ได้เปิดตัวเวอร์ชัน production แบบโอเพนซอร์สของ TurboQuant ซึ่งเป็นอัลกอริทึมบีบอัดหน่วยความจำที่พัฒนาขึ้นโดย Google Research

การเปิดตัวนี้เป็นส่วนหนึ่งของ QVAC SDK 0.12.0 และมุ่งเป้าไปที่แล็ปท็อป โทรศัพท์ อุปกรณ์ edge และเครือข่ายแบบกระจายศูนย์ ช่วยให้โมเดล AI ในเครื่องจัดการ session ที่ยาวขึ้นได้โดยไม่ต้องพึ่งพาโครงสร้างพื้นฐานคลาวด์

นี่ถือเป็นการเปลี่ยนแปลงเชิงปฏิบัติในวิธีที่ AI บนอุปกรณ์จัดการงานที่ต้องใช้หน่วยความจำสูง

TurboQuant บีบอัดหน่วยความจำ AI ได้สูงสุดถึงห้าเท่า

หน่วยความจำเป็นอุปสรรคมายาวนานในการรันโมเดล AI ที่มีประสิทธิภาพบนฮาร์ดแวร์สำหรับผู้บริโภค เมื่อผู้ช่วย AI ประมวลผลเอกสารหรือบทสนทนาที่ยาว ระบบจะเก็บบริบทนั้นไว้ในสิ่งที่เรียกว่า KV cache

ที่ประมาณ 262,000 token KV cache ของโมเดล 4B อาจใช้หน่วยความจำราว 8 GB เพียงอย่างเดียว การรันสี่ session พร้อมกันอาจผลักตัวเลขนั้นไปถึง 32 GB ก่อนที่จะนับตัวโมเดลเอง

TurboQuant แก้ปัญหานี้โดยบีบอัด KV cache ได้สูงสุดถึงห้าเท่า ขณะที่ยังคงคุณภาพของผลลัพธ์ใกล้เคียงกับโมเดลที่ไม่ได้บีบอัด

ผู้ใช้สามารถขอให้ผู้ช่วยบนแล็ปท็อปวิเคราะห์เอกสารกฎหมายหนึ่งร้อยหน้าได้โดยไม่ต้องอัปโหลดไปยังเซิร์ฟเวอร์ระยะไกล

นักเรียน นักพัฒนา นักข่าว และนักวิจัย ต่างสามารถได้รับประโยชน์จาก AI session ที่ยาวขึ้นและรับรู้บริบทได้ดีขึ้น บนอุปกรณ์ที่พวกเขามีอยู่แล้ว

เมื่อพูดถึงเหตุผลเบื้องหลังการเปิดตัวในวงกว้าง CEO ของ Tether อย่าง Paolo Ardoino ได้ชี้ให้เห็นถึงช่องว่างระหว่างงานวิจัยและซอฟต์แวร์เชิงปฏิบัติ

"งานวิจัยของ Google แสดงให้เห็นว่าหน่วยความจำ AI สามารถบีบอัดได้อย่างมีประสิทธิภาพมากกว่าที่คนส่วนใหญ่คิด" เขากล่าว "งานของเราได้นำความก้าวหน้านั้นมาสู่ซอฟต์แวร์ production ที่นักพัฒนา สตาร์ทอัพ และผู้ใช้สามารถนำไปสร้างได้จริง"

การเปิดตัวเวอร์ชัน production ประกอบด้วย pipeline การ quantization แบบเต็มรูปแบบ framework adapter เอกสารสำหรับนักพัฒนา และโปรไฟล์ที่ปรับแต่งตามปริมาณงาน

ส่วนประกอบเหล่านี้ได้รับการออกแบบสำหรับสภาพแวดล้อมจริงนอกเหนือจาก data center ขนาด hyperscale ครอบคลุมหน่วยความจำที่จำกัด ฮาร์ดแวร์แบบผสม และการ deploy ที่ไวต่อ latency

QVAC SDK 0.12.0 ขยายตัวเลือกการพัฒนา AI ในเครื่อง

TurboQuant มาพร้อมกับ QVAC SDK 0.12.0 โดยรวมเข้ากับ Fabric โดยตรง ซึ่งเป็นส่วนประกอบหลักของ QVAC stack

Fabric เริ่มต้นจากการ fork llama.cpp และได้เติบโตขึ้นเพื่อรวมความก้าวหน้าด้านการวิจัยหลายอย่าง SDK มอบชุดเครื่องมือ ไลบรารี และส่วนประกอบ runtime แบบรวมศูนย์สำหรับนักพัฒนาในการสร้างแอปพลิเคชัน AI ในเครื่อง

สำหรับสตาร์ทอัพและนักพัฒนาอิสระ สิ่งนี้ช่วยขจัดความเชื่อที่ว่าผลิตภัณฑ์ AI ขนาดใหญ่ต้องการคลัสเตอร์ GPU ราคาแพง

ทีมงานสามารถออกแบบสำหรับ context window ที่ยาวขึ้น ปริมาณงานไฟล์ที่ใหญ่ขึ้น และการ deploy ที่ยืดหยุ่นบนฮาร์ดแวร์สำหรับผู้บริโภคและ edge ซึ่งเปิดเส้นทางเชิงปฏิบัติในการสร้างผลิตภัณฑ์ AI โดยไม่ต้องพึ่งสถาปัตยกรรมคลาวด์เพียงอย่างเดียว

เพื่อแก้ไขข้อกังวลเกี่ยวกับความเป็นส่วนตัวของข้อมูลและการพึ่งพาคลาวด์ Ardoino ได้สนับสนุนการเก็บงาน AI ไว้บนอุปกรณ์ในเครื่อง

"ผู้คนควรสามารถขอให้ผู้ช่วย AI อ่านเอกสารที่ยาวหรือจัดการข้อมูลส่วนตัวได้ โดยไม่ต้องบังคับให้ทุกงานผ่าน data center ระยะไกล" เขากล่าว TurboQuant ในแง่นั้น มอบพื้นที่ปฏิบัติการที่มากขึ้นให้กับ AI ในเครื่อง

กลยุทธ์ของ Tether มุ่งเน้นที่ AI ที่ทำงานใกล้ชิดผู้ใช้มากขึ้น ทั้งบนอุปกรณ์ส่วนตัวและเครือข่ายแบบกระจายศูนย์ บริษัทมองว่าประสิทธิภาพซอฟต์แวร์และความสามารถในการพกพาเป็นปัจจัยสำคัญในระยะต่อไปของการพัฒนา AI ควบคู่ไปกับโครงสร้างพื้นฐานการประมวลผลขนาดใหญ่

The post Tether Brings Google's TurboQuant to Production, Unlocking Long-Context AI on Everyday Devices appeared first on Blockonomi.

โอกาสทางการตลาด
Gensyn โลโก้
ราคา Gensyn(AI)
$0.03098
$0.03098$0.03098
-3.63%
USD
Gensyn (AI) กราฟราคาสด

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

สมัครสมาชิกเพื่อลุ้นรับสิทธิ์จับรางวัลฟรี

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ [email protected] เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

การถอนเงินจาก Bitcoin ETF แตะ 3.45 พันล้านดอลลาร์ใน 11 วันติดต่อกัน ขณะที่ BTC ร่วงลง

การถอนเงินจาก Bitcoin ETF แตะ 3.45 พันล้านดอลลาร์ใน 11 วันติดต่อกัน ขณะที่ BTC ร่วงลง

Bitcoin ETFs ได้บันทึกกระแสเงินไหลออกสุทธิ 3.45 พันล้านดอลลาร์ใน 11 เซสชันการซื้อขายติดต่อกัน หลังจากมีเงินไหลออกอีก 483.8 ล้านดอลลาร์จากกองทุนเมื่อวันจันทร์ ขณะที่นักลงทุน
แชร์
Crypto.news2026/06/02 14:58
Grayscale HYPE ETF อาจเปิดตัวเร็วๆ นี้ เนื่องจากค่าธรรมเนียมต่ำกว่าคู่แข่ง นักวิเคราะห์กล่าว

Grayscale HYPE ETF อาจเปิดตัวเร็วๆ นี้ เนื่องจากค่าธรรมเนียมต่ำกว่าคู่แข่ง นักวิเคราะห์กล่าว

Grayscale อาจนำกองทุน ETF ที่รองรับ Hyperliquid เข้าสู่ตลาดสหรัฐฯ ได้เร็วที่สุดภายในสัปดาห์นี้ หลังจากแก้ไขเอกสารยื่นต่อหน่วยงานกำกับดูแลเพื่อรวม
แชร์
Crypto Breaking News2026/06/02 14:54
การทำนายเวสต์อินดีส vs ศรีลังกา 2026: ใครจะชนะ อัตราต่อรอง ข่าวทีม และผู้เล่นสำคัญ

การทำนายเวสต์อินดีส vs ศรีลังกา 2026: ใครจะชนะ อัตราต่อรอง ข่าวทีม และผู้เล่นสำคัญ

การคาดการณ์ West Indies VS Sri Lanka นี้ควรถือเป็นการพรีวิวที่อิงจากความน่าจะเป็น มากกว่าผลลัพธ์ที่รับประกันได้ ผลการแข่งขันคริกเก็ตอาจเปลี่ยนแปลงได้อย่างรวดเร็ว เนื่องจากการตัดสินใจในการโยนเหรียญ พฤติกรรมของสนาม การหยุดชะงักจากสภาพอากาศ น้ำค้าง การพังทลายของแบตสแมน การจับคู่โบว์ลิ่ง ความผิดพลาดในการรับลูก และผลงานของแต่ละบุคคล
แชร์
MEXC NEWS2026/06/02 16:37

หุ้น (Beta) เปิดให้ใช้งานแล้ว

หุ้น (Beta) เปิดให้ใช้งานแล้วหุ้น (Beta) เปิดให้ใช้งานแล้ว

เทรดหุ้นสหรัฐจริงผ่านโบรกเกอร์ที่ได้รับการกำกับดูแล