Thursday, July 2, 2026
HomeAIGrok เปิดตัว Voice Agent Builder สร้าง AI รับสายโทรศัพท์ได้

Grok เปิดตัว Voice Agent Builder สร้าง AI รับสายโทรศัพท์ได้

ข่าวใหม่วันนี้ · xAI 1 ก.ค. 2569

ทำได้ใน 2 นาที ไม่ต้องเขียนโค้ดให้วุ่นวาย

xAI ปล่อย Voice Agent Builder Beta — แพลตฟอร์ม No-Code สร้าง AI Agent รับสายได้จริงในระดับ Production ราคา $0.05/นาที ต่ำกว่า Voice Stack ทั่วไปมาก และทำคะแนน Benchmark สูงกว่า Gemini กับ GPT ถึงเกือบ 2 เท่า

2 นาที
สร้าง Agent พร้อมใช้งาน
67.3%
คะแนน Benchmark สูงสุด
$0.05
ราคาต่อนาที รวมทุกอย่าง
25+ ภาษา
รองรับในสายจริง

เกิดอะไรขึ้น

xAI เปิดตัวอะไรวันนี้?

วันที่ 1 กรกฎาคม 2569 xAI บริษัท AI ของ Elon Musk ประกาศเปิดตัว Voice Agent Builder ในช่วง Beta อย่างเป็นทางการ โดยสร้างอยู่บน Grok Voice Think Fast 1.0 ที่เปิดตัวไปก่อนหน้า

แนวคิดหลักคือ Operator หรือ Developer ที่ต้องการ AI รับสายโทรศัพท์ระดับ Production ไม่ว่าจะเป็น Call Center ร้านค้า ระบบ Support หรือสายจอง สามารถสร้างและ Deploy Agent ที่พร้อมรับสายจริงได้ ใน 2 นาที โดยไม่ต้องเขียนโค้ดแม้แต่บรรทัดเดียว

สิ่งที่ทำให้ Voice Agent Builder ต่างจาก Voice Chatbot ทั่วไปคือ xAI ออกแบบให้ใช้เส้นทาง Speech-to-Speech ตรงๆ แทนการต่อ 3 API คนละเจ้า (Speech-to-Text → LLM → Text-to-Speech) ซึ่งเป็นวิธีที่ทุก Voice Stack ในตลาดใช้อยู่ตอนนี้ ทำให้ Latency ต่ำกว่า ต้นทุนต่ำกว่า และ Failure Point น้อยกว่ามาก


ประสิทธิภาพ

Grok Voice ทิ้งห่าง Gemini และ GPT บน τ-voice Bench

xAI เปิดเผย Benchmark ภายใต้ชื่อ τ-voice Bench ที่วัดประสิทธิภาพของ Voice Agent ในสภาพสายจริง มีเสียงรบกวน สำเนียงหนัก ลูกค้าพูดขัดกลาง คำถามที่ต้องใช้ข้อมูลจากหลาย Tool และ Workflow ที่ซับซ้อน

Grok Voice Think Fast 1.0
67.3%
Gemini 3.1 Flash Live
43.8%
GPT Realtime 1.5
35.3%

* τ-voice Bench วัดใน Scenario จริง: Retail, Airline, Telecom อ้างอิงจาก xAI Official Announcement

Grok Voice ทำคะแนนได้ 67.3% สูงกว่า Gemini Flash Live ถึง 53% และสูงกว่า GPT Realtime ถึง 90% แต่ควรพิจารณาด้วยว่า Benchmark นี้สร้างโดย xAI เอง การเปรียบเทียบใน Environment จริงอาจแตกต่างกันตาม Use Case


ฟีเจอร์หลัก

Voice Agent Builder ทำอะไรได้บ้างในทางปฏิบัติ

  • 📄
    Knowledge Base จากไฟล์ของคุณเอง — อัปโหลดเอกสาร Policy, คู่มือสินค้า, FAQ ในรูปแบบ TXT, Markdown, Word, PowerPoint, Excel, HTML หรือ JSON แล้ว Agent จะดึงข้อมูลจากไฟล์เหล่านั้นระหว่างสายโดยอัตโนมัติ ไม่ต้อง Hard-code ข้อมูลลงใน Prompt ทั้งหมด
  • 🔧
    Tool และ Connector เชื่อมระบบที่มีอยู่ — จองนัดใน Google Calendar / Outlook, ดึงสถานะออเดอร์จาก API ของคุณ, คืนเงินในระบบ, ค้นหาข้อมูลจากเว็บหรือ X, จัดการ Ticket ใน Linear หรือ Notion และดึงไฟล์จาก Google Drive หรือ OneDrive
  • 📞
    เบอร์โทรฟรี + รองรับเบอร์เดิมผ่าน SIP — ทุกบัญชีได้เบอร์โทรศัพท์ฟรี 1 เบอร์ สำหรับเริ่มทดสอบได้ทันที หรือจะนำเบอร์ที่มีอยู่แล้วมา Connect ผ่าน SIP โดยไม่ต้องเปลี่ยนเบอร์
  • 🎙️
    เสียง 80+ แบบ หรือ Clone เสียงแบรนด์ — เลือกจากเสียงสำเร็จรูปกว่า 80 แบบ หรือ Clone เสียงของแบรนด์จากตัวอย่างเพียง 2 นาที ทำให้ Agent ฟังดูสอดคล้องกับ Brand Identity
  • 📊
    บันทึกทุกสาย + ระบบ Guardrail — ทุกสายถูกบันทึกทั้งเสียงและ Transcript พร้อมแสดงว่า Agent ใช้ Tool ไหนบ้างระหว่างสาย มีระบบ Guardrail กำหนดขอบเขตที่ Agent ไม่ควรทำ

ราคา

ราคา $0.05/นาที — ง่ายและโปร่งใสกว่า Voice Stack อื่น

ปัญหาของ Voice Stack ทั่วไปคือต้องจ่ายแยกหลายตัว (Speech-to-Text, LLM, Text-to-Speech, Platform Fee) ทำให้ยากมากที่จะคำนวณว่าสายหนึ่งจะแพงเท่าไหร่ xAI แก้ปัญหานี้ด้วยราคาแบบ All-in ตัวเดียว

โครงสร้างราคา xAI Voice Agent Builder

  • Voice API — $0.05/นาที รวม STT + LLM + TTS ทั้งหมด ไม่มี Platform Fee แยก
  • Telephony (เบอร์ฟรีของ xAI) — $0.01/นาทีเพิ่ม
  • SIP เบอร์เดิม — ไม่มีค่าเพิ่มจาก xAI (ขึ้นอยู่กับผู้ให้บริการ Telephony ของคุณ)

สาย 1 นาทีด้วยเบอร์ฟรีของ xAI รวมทุกอย่าง = $0.06/นาที

อ้างอิงจาก xAI Pricing Documentation


วิเคราะห์

ใครควรสนใจและข้อควรระวัง

  • SME และร้านค้าออนไลน์ไทย — ที่ต้องการ Agent รับสายจอง แจ้งสถานะออเดอร์ หรือตอบ FAQ ซ้ำๆ โดยไม่ต้องจ้างพนักงานรับสายตลอด 24 ชั่วโมง ราคา $0.05/นาทีถือว่าต่ำกว่าทางเลือกอื่นมาก
  • Developer ที่เคยสร้าง Voice Bot — ถ้าเคยเจอปัญหา Latency สูงจากการต่อ 3 API คนละเจ้า Voice Agent Builder แก้ปัญหานี้โดยตรงด้วย Speech-to-Speech Path เดียว
  • ⚠️
    ข้อควรระวัง — ยังอยู่ในช่วง Beta และ Benchmark มาจาก xAI เอง ควรทดสอบ Use Case จริงก่อนนำไปใช้ใน Production ระดับสูง และตรวจสอบ Data Privacy ให้สอดคล้องกับมาตรฐานธุรกิจของคุณก่อน

นี่เป็นอีกก้าวใหญ่ที่แสดงว่า Grok ไม่ได้มุ่งแค่ด้าน Text หรือ Image อีกต่อไป — ก่อนหน้านี้เราเคยรายงาน Grok Imagine Video 1.5 และ Lightricks LTX Trainer ไปแล้ว และ Voice Agent Builder วันนี้สะท้อนให้เห็นว่า xAI กำลังขยาย Product Line ครอบคลุมทุก Modality อย่างรวดเร็ว

สรุปทุกอย่างใน 5 บรรทัด

  • xAI เปิดตัว Voice Agent Builder Beta วันที่ 1 ก.ค. 2569 — สร้าง AI รับสายระดับ Production ใน 2 นาที ไม่ต้องเขียนโค้ด
  • Grok Voice ทำ Benchmark 67.3% ทิ้งห่าง Gemini (43.8%) และ GPT Realtime (35.3%) บน τ-voice Bench ของ xAI
  • ราคา $0.05/นาที รวม STT + LLM + TTS ทั้งหมด — โปร่งใสกว่า Voice Stack ที่บิลแยกทุก Component
  • รองรับ Knowledge Base จากไฟล์ของคุณ, Tool/API ภายนอก, 80+ เสียง, Clone เสียงแบรนด์, บันทึกทุกสาย
  • รองรับ 25+ ภาษา ออกแบบมาจาก Real Call Data — รับ Accent หนักและเสียงรบกวนได้ในสายจริง

อยากรู้ว่า Grok ทำอะไรได้บ้างก่อนหน้านี้?

ก่อน Voice Agent Builder xAI เพิ่งเปิดตัว Grok Imagine Video 1.5 ที่สร้างวิดีโอจากรูปได้เร็วขึ้น 2 เท่า พร้อม Physics ที่ดีขึ้นมาก และ Lightricks LTX Trainer 13 โหมด

อ่าน Grok Video และ Lightricks ล่าสุด

แหล่งอ้างอิง

บทความนี้เป็นการวิเคราะห์เชิงบรรณาธิการอ้างอิงจาก xAI Official Announcement Benchmark มาจาก xAI และควรตรวจสอบในสภาพแวดล้อมจริงก่อน Deploy ใน Production อัปเดต 1 กรกฎาคม 2569 Rechargeland.com

RELATED ARTICLES
- Advertisment -

Most Popular

Recent Comments