Large Language Model

Tags:
Node Thumbnail

Meta เปิดตัวเครื่องมือตกแต่งแก้ไขรูปภาพด้วย Generative AI สำหรับทุกแพลตฟอร์มทั้ง Instagram, Facebook, WhatsApp และ Messenger

เครื่องมือแรกคือการแก้ไขรูปภาพสำหรับลง Instagram มีสองฟีเจอร์คือ Restyle โดยป้อน prompt สไตล์ของภาพที่ต้องการ และ Backdrop สำหรับตัดต่อใส่ฉากหลังให้กับภาพตามต้องการ

เครื่องมืออีกชุดคือสติกเกอร์ AI สามารถใช้งานได้ทั้งใน Facebook Stories, Instagram Stories, Instagram DM, Messenger และ WhatsApp สามารถสร้างสรรค์สติกเกอร์ได้ตาม prompt ที่ระบุ เทคโนโลยีนี้ Meta บอกว่าใช้โมเดล Llama 2 และ Emu ในการรับข้อมูลและสร้างสรรค์ภาพวาดขึ้นมา

Tags:
Node Thumbnail

Lamini บริษัทขายแพลตฟอร์มฝึกและรันโมเดลปัญญาประดิษฐ์ รวมมือถือกับ AMD เปิดตัว LLM Superstation เซิร์ฟเวอร์สำหรับรันปัญญาประดิษฐ์ LLM โดยเฉพาะ เปิดเครื่องมามี Llama 2-70B ให้ใช้งานทันที

ความพิเศษของ LLM Superstation คือใช้การ์ด AMD Instinct MI250 แทนที่จะเป็นการ์ด NVIDIA ที่อุตสาหกรรมนิยมกัน ความได้เปรียบของ MI250 คือมันใส่แรมมาถึง 128GB ทำให้รันโมเดลขนาดใหญ่ได้ง่ายกว่าการ์ด A100 (NVIDIA เริ่ม ใส่แรมเยอะขึ้นในการ์ดรุ่นหลังๆ ) และข้อดีสำคัญอีกอย่างคือรอสั่งเครื่องเร็วกว่าเซิร์ฟเวอร์ที่ใช้การ์ด NVIDIA

Tags:
Topics: 
Node Thumbnail

Oracle ประกาศเตรียมเพิ่มฟีเจอร์ vector search เข้าไปยังซอฟต์แวร์ Oracle Database 23c รองรับการใช้งานมากขึ้นเนื่องจากช่วงหลังมีการใช้งานปัญญาประดิษฐ์ในกลุ่มโมเดลภาษาขนาดใหญ่ (large language model - LLM) จำนวนมาก

Tags:
Topics: 
Node Thumbnail

OpenAI เพิ่มฟีเจอร์ให้ ChatGPT เวอร์ชั่นโทรศัพท์มือถือ โดยเปิดให้ผู้ใช้สามารถพูดคุยกับ ChatGPT ด้วยเสียงพูดได้โดยตรง โดยการแปลงคำพูดของผู้ใช้เป็นข้อความนั้นใช้ Whisper โมเดลปัญญาประดิษฐ์ที่ OpenAI เคยเปิดออกมาก่อนหน้านี้ ขณะที่โมเดลแปลงข้อความเป็นเสียงนั้นสร้างขึ้นใหม่ด้วยการจ้างทีมพากย์มืออาชีพ

ฟีเจอร์อีกส่วนคือการรับภาพที่ OpenAI เคยประกาศตั้งแต่ตอนเปิดตัว GPT-4 ว่ารองรับอินพุตเป็นภาพ ตอนนี้ก็เปิดโหมด multimodal ให้ใช้งานทั้ง GPT-3.5 และ GPT-4 (เรียกว่า GPT-4V) ฟีเจอร์นี้อ่านภาพได้หลากหลาย ตั้งแต่ภาพถ่ายปกติ จนถึงเอกสารที่มีภาพและข้อความประกอบกัน

Tags:
Node Thumbnail

Amazon ประกาศลงทุนในสตาร์ตอัพปัญญาประดิษฐ์ Anthropic โดยเตรียมเข้าใช้แพลตฟอร์ม AWS ในการให้บริการเต็มตัว

รูปแบบของดีลนี้นับว่าคล้ายกับ OpenAI และไมโครซอฟท์พอสมควร โดย Anthropic จะพัฒนาเทคโนโลยีของตัวเองผูกเข้าไปกับเทคโนโลยีของ AWS ตั้งแต่การฝึกปัญญาประดิษฐ์ด้วย AWS Trainium รันโมเดลด้วย Inferentia และให้บริการผ่านบริการ Amazon Bedrock ทั้งโมเดล Claude มาตรฐานและการทำ fine-tuning หลังจากนี้ AWS ก็จะลงทุนวางโครงสร้างพื้นฐานให้เพียงพอสำหรับ Anthropic

Tags:
Node Thumbnail

สำนักข่าว Bloomberg รายงานถึงมหาวิทยาลัยหลายแห่งในสหรัฐฯ เริ่มปิดฟีเจอร์ตรวจจับงานเขียนที่เขียนด้วย AI ของบริการ Turnitin ที่ปกติใช้ตรวจจับการลอกงาน แต่เมื่อทาง Turnitin เปิดฟีเจอร์ตรวจจับการเขียนด้วย AI กลับให้ผลที่ผิดพลาดสูงจนอาจจะกระทบกับนักศึกษาที่ถูกกล่าวหาได้

มหาวิทยาลัย Vanderbilt วิจารณ์ Turnitin ว่าเปิดฟีเจอร์นี้ให้มหาวิทยาลัยเองโดยแจ้งล่วงหน้าเพียงไม่ถึงวัน และยังอ้างว่ามีอัตราการผิดพลาดแบบ false positive (จับว่าใช้ AI เขียนแม้เขียนเอง) เพียง 1% แต่กลับไม่ได้บอกกระบวนการทำงานภายใน เมื่อใช้งานจริงก็พบว่ามีความผิดพลาดจำนวนมาก และระบบมักจับว่างานเขียนที่เขียนโดยนักศึกษาที่ไม่ได้ใช้ภาษาอังกฤษเป็นภาษาหลักเป็นงานที่เขียนโดย AI มากกว่าปกติ

Tags:
Node Thumbnail

หลังจากเราเห็นไมโครซอฟท์ทยอยเปิดตัวฟีเจอร์ Copilot ที่ใช้พลัง AI ตามบริการต่างๆ ในเครือมาตั้งแต่ต้นปี เมื่อคืนนี้ไมโครซอฟท์เปิดตัวแบรนด์ Microsoft Copilot อย่างเป็นทางการ โลโก้แนวสีสันสดใส และสโลแกน Your everyday AI companion (นี่มัน Cortana คืนชีพ?)

Microsoft Copilot จะอยู่ทั้งในรูปแอพแยกบน Taskbar ของ Windows และฟีเจอร์ที่ฝังรวมในแอพต่างๆ โดยให้ประสบการณ์เดียวกัน (a single experience) ในเบื้องต้นจะมีให้ใช้งาน 4 จุดคือ

Tags:
Node Thumbnail

บริการ Microsoft 365 Copilot ที่รวมเอา ChatGPT เข้ากับโปรแกรมต่างๆ ในชุด Microsoft 365 นับเป็นบริการสำคัญที่หลายคนตั้งหน้าตั้งตารอให้ไมโครซอฟท์เปิดตัว แม้ว่าจะมีค่าใช้จ่ายถึง 30 ดอลลาร์ต่อคน ที่ผ่านมาไมโครซอฟท์ประกาศฟีเจอร์และราคาออกมาก่อน และตอนนี้ก็ประกาศวันเปิดตัวเป็นทางการแล้ว คือ 1 พฤศจิกายนนี้

Tags:
Topics: 
Node Thumbnail

กูเกิลอัพเดตบริการ Bard โดยฟีเจอร์สำคัญคือการรองรับส่วนขยาย ที่ทำให้ Bard สามารถดึงข้อมูลจากบริการอื่นๆ ได้แก่ Maps, YouYube, Hotels, และ Flights มาได้ ทำให้เราสามารถถามตอบคำถามเกี่ยวข้องกับบริการของกูเกิลได้แม่นยำขึ้น

แต่ส่วนขยายสำคัญคือการดึงข้อมูลจาก Workspace รวม Gmail, Docs, และ Drive ทำให้เราสามารถสั่ง Bard ให้สรุปหรือตอบคำถามจากเอกสารในบริการเหล่านี้ได้ โดยกูเกิลสัญญาว่าจะไม่ใช้ข้อมูลในเอกสารเหล่านี้ฝึก Bard

Tags:
Node Thumbnail

เว็บไซต์ The Information รายงานว่ากูเกิลเริ่มเปิดทดสอบ Gemini โมเดลปัญญาประดิษฐ์รุ่นถัดไป ให้กับลูกค้าบางรายในวงปิดแล้ว เป็นสัญญาณว่าเราจะได้เห็น Gemini เปิดบริการต่อสาธารณะในเร็ววัน

กูเกิลเปิดตัว Gemini ครั้งแรกในงาน Google I/O 2023 เดือนพฤษภาคม โดยเป็นโมเดลเวอร์ชันถัดไปจาก PaLM 2 ที่นำมาใช้งานจริงในผลิตภัณฑ์กูเกิลแล้ว และ เป็นโปรเจคร่วมของ Google และ DeepMind ที่รวมร่างกันเป็น Google DeepMind อีกทั้งมีข่าวลือว่า Sergey Brin ผู้ร่วมก่อตั้งกูเกิลกลับมาช่วยงานโปรเจคนี้ด้วย

Tags:
Node Thumbnail

ไมโครซอฟท์ประกาศแนวทาง Copilot Copyright Commitment ปกป้องลูกค้าที่ใช้บริการในกลุ่ม Copilots จากการฟ้องร้องลิขสิทธิ์ ครอบคลุมตั้งแต่ Bing Chat Enterprise, Microsoft 365 Copilot, และ GitHub Copilot

ไมโครซอฟท์ระบุว่าจะช่วยจ่ายค่าเสียหายทั้งจากการตัดสินคดีหรือการตกลงนอกศาล หากผู้ใช้ใช้งาน Copilot โดยเปิดฟีเจอร์ป้องกันต่างๆ เช่น guardrails และ content filter ครบถ้วนแล้ว โดยฟีเจอร์เหล่านี้ควรกรองผลคำตอบต่างๆ ที่อาจจะเป็นการละเมิดลิขสิทธิ์ออกไปแล้วก่อนใช้งาน

Tags:
Node Thumbnail

มีรายงานจาก The Wall Street Journal พูดถึงแผนการพัฒนา AI ผู้ช่วยตัวใหม่ของ Meta บริษัทแม่ของ Facebook และ Instagram โดยมีเป้าหมายให้ความสามารถสูงกว่าโมเดล Llama 2 ที่เปิดตัวเมื่อสองเดือนที่แล้ว และสามารถแข่งขันกับ GPT-4 ของ OpenAI ได้

แผนการเทรนโมเดลใหม่ดังกล่าวจะเริ่มในต้นปี 2024 เนื่องจาก Meta จะใช้เซิร์ฟเวอร์ประมวลผลในศูนย์ข้อมูลตนเองทั้งหมด แตกต่างจาก Llama 2 ที่ ใช้ทรัพยากรของ Azure จากไมโครซอฟท์ ซึ่งตอนนี้บริษัทก็รับสมัครพนักงานที่เกี่ยวข้อง รวมถึงสั่งซื้อจีพียู H100 จาก NVIDIA จำนวนมากอีกด้วย

Tags:
Node Thumbnail

กลุ่มฟินเทค Ant Group เปิดตัวโมเดล AI สร้างเนื้อหาหรือ Generative AI สำหรับสายการเงินโดยเฉพาะ ซึ่ง Ant เรียกว่า Financial LLM โดยมาพร้อมกับแอพพลิเคชันทางการเงินที่ใช้โมเดลดังกล่าวคือ Zhixiaobao 2.0 ผู้ช่วยทางการเงินสำหรับลูกค้าบุคคล และ Zhixiaozhu 1.0 ผู้ช่วยทางการเงินสำหรับลูกค้าสถาบันการเงิน

โดย Zhixiaobao 2.0 จะเข้ามาช่วยทั้งการแนะนำการจัดพอร์ตการลงทุน การกระจายสินทรัพย์ลงทุน ตลอดจนให้ความรู้ทางการเงิน ขณะที่ Zhixiaozhu 1.0 จะมาช่วยในงานการเป็นที่ปรึกษาการลงทุน อ่านบทวิเคราะห์การลงทุน ประเมินโอกาสทางการลงทุน และช่วยสร้างเนื้อหาบทวิเคราะห์

Tags:
Node Thumbnail

The Information มีรายงานล่าสุดเกี่ยวกับโครงการ พัฒนาแชตบอท AI ของแอปเปิล ที่ใช้งานกันภายในบริษัท ซึ่งมีชื่อเล่นว่า Ajax GPT บอกว่าตอนนี้โครงการใช้เงินระดับ หลายล้านดอลลาร์ต่อวัน ในการพัฒนาและเทรนโมเดล ขนาดมากกว่า 2 แสนล้านพารามิเตอร์

โมเดลที่พัฒนาตอนนี้มีคำเรียกภายในว่า Foundational Models มีทีมงานประมาณ 16 คน บางคนเป็นอดีตวิศวกรของกูเกิล โดย John Giannandrea รองประธานอาวุโสดูแลด้าน AI เป็นผู้ดูแลทีมนี้ (ซึ่งเขาก็เคยทำงานกูเกิล)

Tags:
Node Thumbnail

TII (หรือ Technology Innovation Institute) เป็นสถาบันเทคโนโลยีของอาบูดาบี ได้เปิดตัวโมเดล Falcon ที่ขนาด 180 พันล้านพารามิเตอร์ ในชื่อ Falcon 180B ที่ถูกฝึกบนชุดข้อมูลกว่า 3.5 ล้านล้านโทเคน (จำนวนหน่วยย่อยของคำในทางงานประมวลผลภาษาธรรมชาติ) บนการ์ดจอ 4,096 ตัว ด้วยเวลาประมาณ 7,000,000 ชั่วโมงของการ์ดจอ หลังจากที่เคยเปิดตัว Falcon 40B มาก่อนโดน Llama 2 แซงในเวลาต่อมาด้วยขนาด 70 พันล้านพารามิเตอร์ที่ใหญ่กว่า

Tags:
Topics: 
Node Thumbnail

Baidu เปิดตัว ERNIE ปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) ที่เน้นภาษาจีนให้คนทั่วไปใช้งาน หลังจาก จำกัดการใช้งานเฉพาะบริษัทที่ได้รับสิทธิ์ทดลองเท่านั้น และตอนนี้แอป Ernie ก็กลายเป็นแอปยอดนิยมในจีนอย่างรวดเร็ว

ผู้ใช้ ERNIE ต้องลงทะเบียนด้วยหมายเลขประจำตัวประชาชนเท่านั้นและตัวแชตบอตเตือนผู้ใช้ว่าหากพยายามคุยประเด็นอ่อนไหวหรือมีความเสี่ยงทางกฎหมายนั้นผู้ใช้จะเป็นผู้รับผิดชอบเอง

Tags:
Node Thumbnail

Google Cloud มีบริการเช่ารันโมเดล AI ชื่อ Vertex AI ที่ให้บริการมาสักระยะหนึ่งแล้ว และ เปิดบริการโมเดล Generative AI เมื่อเดือนพฤษภาคมที่ผ่านมา โดยมีทั้งโมเดลของกูเกิลเอง และโมเดลจากบริษัทอื่นด้วย กูเกิลเรียกบริการนี้ว่า Model Garden

ล่าสุดในงาน Google Cloud Next '23 เมื่อคืนนี้ กูเกิลประกาศเพิ่มโมเดลของพาร์ทเนอร์อีกหลายตัว ได้แก่

Tags:
Node Thumbnail

กูเกิลประกาศว่าบริการ Duet AI ที่นำความสามารถของ Generative AI มาใช้กับบริการของ Google Workspace ตอนนี้เปิดให้สำหรับผู้ใช้งานทุกคนแล้ว

ในประกาศนี้กูเกิลยังนำ Duet AI มาใส่ใน Google Meet โดยนอกจากระบบจัดการภาพและเสียง ยังมีฟีเจอร์อื่นดังนี้

Tags:
Node Thumbnail

นอกจาก Google Meet กูเกิลยังประกาศนำความสามารถด้าน Generative AI ของ Duet AI มาเพิ่มในบริการ Google Chat ด้วยเช่นกัน

โดย Google Chat จะทำงานโดยมี Duet AI ทำหน้าที่เป็นแชทบอตหนึ่งในลิสต์สำหรับสนทนาโต้ตอบ ซึ่งมีความสามารถช่วยอัพเดต ค้นหาข้อมูล ตลอดจนให้คำแนะนำคำตอบ ผ่านการค้นหาเนื้อหาจากข้อความในอดีต และไฟล์ในแพลตฟอร์ม Google Workspace ซึ่งจะช่วยให้การทำงานต่อเนื่องและมีประสิทธิภาพมากขึ้น

ในหน้าแชทรวมยังปรับปรุงหมวดหมู่แบ่งเป็น Home รวมทุกข้อความ, Mentions รวมแชทที่ถูกระบุถึง และ Starred โดยปรับฟอนต์และสีพื้นหลัง เพื่อให้มองหาข้อความได้สะดวกมากขึ้น

Tags:
Node Thumbnail

Yahoo Mail ประกาศเพิ่มความสามารถด้าน AI หลังจากทดสอบในสถานะเบต้ากับผู้ใช้ iOS ซึ่งตอนนี้ขยายมากลุ่มผู้ใช้งานผ่านเบราว์เซอร์ด้วย โดยมีฟีเจอร์เด่นรองรับการช้อปปิ้ง

ความสามารถใหม่ที่เพิ่มเข้ามาชื่อว่า Shopping Saver ซึ่งจะค้นหาโค้ดและบัตรของขวัญในอินบอกซ์ เพื่อดูว่ามีเครดิตส่วนไหนที่ยังไม่ได้ใช้ และจะแนะนำเมื่อร่างอีเมลเพื่อเตือนให้ใช้งานโค้ดส่วนนี้

นอกจากนี้ Yahoo Mail ยังเพิ่มและปรับปรุงความสามารถใหม่เกี่ยวกับ AI ซึ่งรองรับด้วยเทคโนโลยีของ Google Cloud เช่น ระบบเสิร์ชที่รองรับประโยคคำถาม ระบบแนะนำการเขียนอีเมลในฟอร์แมตที่ต้องการ และตัวช่วยสรุปเนื้อหาอีเมล

ที่มา: Yahoo

Tags:
Node Thumbnail

Meta ปล่อย Code Llama โมเดลปัญญาประดิษฐ์ที่พัฒนาต่อจาก Llama2 มาฝึกกับซอร์สโค้ดขนาด 500 ล้านโทเค็น ได้โมเดลทั้งแบบเติมโค้ดปกติ, แบบรับคำสั่ง, และโมเดลฝึกเฉพาะกับโค้ด Python

ผลทดสอบการเขียนโค้ด HumanEval นั้น Code Llama ขนาด 34B ได้คะแนนดีกว่าโมเดลอื่นๆ ทั้งหมด รวมถึง GPT-3.5 หรือ ChatGPT ด้วย เป็นรองเพียง GPT-4 เท่านั้น ขณะที่โมเดลขนาดรองลงมา เช่น 7B และ 13B ก็ยังทำคะแนนได้ดีและตอบสนองเร็วกว่ามาก

กระบวนการฝึก Code Llama นั้นเน้นถึงการเติมโค้ดตรงกลางเพิ่มเข้ามา เนื่องจากการใช้งานมักต้องใช้สำหรับ code completion ด้วย และต้องฝึกให้ขยาย context จาก 4K เป็น 100K เพื่อให้เพียงพอสำหรับการเขียนโค้ดขนาดใหญ่ๆ

Tags:
Node Thumbnail

OpenAI ประกาศว่าความสามารถ Fine-tuning หรือการปรับแต่งค่าให้เข้ากับแต่ละ use cases สำหรับ GPT-3.5 Turbo ตอนนี้เปิดให้ใช้งานแล้ว ส่วน Fine-tuning ของ GPT-4 จะเปิดให้ใช้งานได้ในช่วงปลายปี

คุณสมบัติ Fine-tuning เป็นความสามารถสำคัญโดยเฉพาะการนำ ChatGPT ไปใช้ในภาคธุรกิจ เพื่อให้ AI ทำงานได้ตรงกับลักษณะงานที่ระบุ ทำให้บอทมีลักษณะเฉพาะตัวไม่เหมือนการใช้งานทั่วไป

OpenAI ยกตัวอย่างเคสที่ใช้ Fine-tuning ในช่วงทดสอบเบต้า เช่น ระบุให้ ChatGPT ตอบเป็นภาษาเดียวกับ Prompt เสมอ, การกำหนดโทนการตอบคำถามให้เข้ากับอัตลักษณ์ของแบรนด์นั้น และในหลายกรณีทำให้การโต้ตอบทำได้ตรงประเด็นและเร็วขึ้น ลดปริมาณการเรียก API

Tags:
Node Thumbnail

ไอบีเอ็มเปิดตัว IBM Watsonx Code Assistant for Z โซลูชัน AI สำหรับแปลโค้ดที่เขียนในภาษา COBOL ให้เป็น Java สำหรับเมนเฟรม IBM Z โดยจะเปิดให้ใช้งานทั่วไปภายในไตรมาสที่ 4 ปี 2023 ซึ่งเป็นส่วนหนึ่งของโครงการเปลี่ยนผ่านแอพพลิเคชัน COBOL ไปสู่โค้ดในภาษาปัจจุบันที่มีต้นทุนจัดการน้อยกว่า และทำได้รวดเร็วขึ้น

Watsonx Code Assistant for Z เป็นเครื่องมือที่สร้างจาก Watsonx.ai บริการสร้างโมเดลของแพลตฟอร์ม WatsonX ที่ตอนนี้มีความเข้าใจภาษาคอมพิวเตอร์ 115 ภาษา จากชุดข้อมูลมากกว่า 1.5 ล้านล้านโทเค็น

Tags:
Node Thumbnail

NCSoft บริษัทเกมรายใหญ่ของเกาหลีใต้ เจ้าของเกม Lineage และ Guild Wars เปิดตัวชุดเทคโนโลยีปัญญาประดิษฐ์ เป็นโมเดลภาษาขนาดใหญ่ LLM ชื่อ VARCO สำหรับช่วยสร้างเกม

VARCO ย่อมาจาก "Via AI, Realize your Creativity and Originality" ประกอบด้วยโมเดล 4 ตัวทำงาน 4 ด้านคือ Foundation, Prompt, Dialogue, Generative

งานที่ทำได้ตอนนี้มี 3 อย่างคือ

  • VARCO Art - text-to-image generation
  • VARCO Text - text generation
  • VARCO Human - ชุดเครื่องมือจัดการ digital humans (น่าจะหมายถึงตัวละครในเกม)

โมเดลชุดแรกที่ปล่อยออกมายังมีเฉพาะภาษาเกาหลี และเป็นโมเดลขนาดเล็ก-กลาง ส่วนโมเดลในภาษาอังกฤษจะทยอยปล่อยตามมาภายในเดือนนี้ และโมเดลขนาดอื่นๆ จะตามมาในลำดับถัดไป

Tags:
Node Thumbnail

กูเกิลแสดงผลการทดลองใช้ปัญญาประดิษฐ์ในกลุ่ม Large Language Model (LLM) มาเขียนโค้ดยิงไลบรารีต่างๆ ภายใต้ โครงการ OSS-Fuzz เพื่อหาช่องโหว่ซอฟต์แวร์

การทดสอบแบบ fuzzing ช่วยให้พบช่องโหว่แบบที่คนคิดไม่ถึงโดยเฉพาะช่องโหว่หน่วยความจำ ด้วยการอาศัยการยิงอินพุตแบบสุ่ม อย่างไรก็ดีโค้ดที่ใช้ทดสอบนั้นต้องเขียนด้วยมือทำให้ชุดทดสอบต่างๆ มักครอบคลุมโค้ดที่ต้องการทดสอบไม่มากนัก โดยเฉลี่ยครอบคลุมเพียง 30% เท่านั้น

ทีมงานกูเกิลเขียน prompt ให้ LLM ของกูเกิลเองเขียนโค้ดสำหรับทดสอบ หากโค้ดรันไม่ผ่านก็สามารถอ่าน error แล้วแก้ไขโค้ดใหม่ไปได้ ข้อดีสำคัญคือโค้ดที่ได้จะทดสอบส่วนต่างๆ ของโครงการโอเพนซอร์สได้เพิ่มเติม ทำให้ความครอบคลุมโดยรวมดีขึ้น

Pages