優設問答你的職場經驗書

首席爆料師 邀你回答

2024/04/26

Sam Altman 最新公開演講:GPT-5將會比GPT-4更強大,GPT-6將會比GPT-5更智能,有哪些信息值得關注?

4月25日晚,OpenAI聯合創始人兼首席執行官Sam Altman,在斯坦福大學的英偉達(NVIDIA)禮堂進行了公開演講,超過1000名學生排隊參加此次活動。

Altman說:“GPT-5將會比GPT-4更強大,GPT-6將會比GPT-5更智能,OpenAI的終極目標始終都沒有變就是實現——AGI(通用人工智能)。”

以下是本次演講的一些關鍵信息總結: 1. Sam Altman的演講:作為OpenAI的聯合創始人兼首席執行官,Sam Altman在斯坦福大學的NVIDIA禮堂進行了演講,吸引了超過1000名學生。 2. AI的未來發展:Altman認為,人類尚未達到AI的極限,并且OpenAI的目標是實現通用人工智能(AGI)。他提到GPT-5將比GPT-4更強大,而GPT-6將比GPT-5更智能。 3. 開源與閉源:Altman認為,為了實現AGI,需要大量的資金投入,因此開源可能不是最佳途徑。OpenAI從最初的開源策略轉變為閉源,以確保商業回報和持續創新。 4. 資金與投資:他提到,為了推動AGI的發展,無論每年需要多少資金,只要能為全人類和AI領域做出貢獻,他都不在乎。 5. OpenAI的核心能力:OpenAI的核心能力在于技術變革,能夠定義AI能力的下一個范式轉變。 6. Sora模型:OpenAI發布了文生視頻模型Sora,這可能會對影視、游戲開發、廣告營銷等行業產生重大影響。 7. 免費使用ChatGPT:OpenAI宣布無需注冊就能免費使用ChatGPT,這有助于那些沒有能力開發類似產品的國家或地區。 8. 英偉達與OpenAI的合作:英偉達創始人黃仁勛向OpenAI捐贈了先進的AI超級計算機,這表明了兩家公司之間的緊密合作關系。

點贊 18 回答 2

大白(●—●) 邀你回答

2024/04/25

蘋果也加入AI革新浪潮了,OpenELM 大模型開源,大模型領域會迎來新風向嗎?

4月24日,蘋果開源了大語言模型OpenELM。這與微軟剛開源的Phi-3 Mini類似,是一款專門針對手機等移動設備的模型。

以下是一些重點信息的摘要: 1. 開源OpenELM: 蘋果公司開源了一個名為OpenELM的大語言模型,這與微軟開源的Phi-3 Mini類似,是專為移動設備設計的模型。 2. 模型參數: OpenELM提供了四種不同參數規模的模型,分別是2.7億、4.5億、11億和30億參數。 3. 功能: 該模型能夠執行生成文本、代碼、翻譯、總結摘要等功能。 4. 預訓練數據: 盡管最小的模型只有2.7億參數,但蘋果使用了1.8萬億tokens的數據進行預訓練,這是其小參數下仍能表現出色的原因之一。 5. 深度神經網絡庫CoreNet: 蘋果同時開源了用于訓練OpenELM的深度神經網絡庫CoreNet,該庫在開源后不久就在GitHub上獲得了超過1100個星標。 6. 蘋果的開源策略: 蘋果通常在手機領域采取閉源策略,但此次開源可能是為了吸引用戶,未來可能會推出閉源產品實現商業化。 7. 技術貢獻: 蘋果不僅發布了模型權重和推理代碼,還發布了完整的訓練和評估框架,包括數據準備、模型訓練、微調和評估流程,以及多個預訓練檢查點和訓練日志。 8. OpenELM架構: OpenELM的架構,包括其技術創新點,如無編碼器的transformer架構、層級縮放策略、不使用全連接層中的可學習偏置參數等。 9. 訓練流程與數據集: 蘋果使用CoreNet作為訓練框架,Adam優化算法,以及動態分詞和數據過濾的方法。

開源地址:https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca?ref=maginative.com CoreNet地址:https://github.com/apple/corenet?ref=maginative.com 論文地址:https://arxiv.org/abs/2404.14619

點贊 9 回答 2

首席爆料師 邀你回答

2024/04/19

模型未發 API 先至!Stable Diffusion 3 API 發布,其性能是否能與 Midjourney v6 相媲美?

Stability AI 開發者平臺 API 現已支持最新版本的 Stable Diffusion3(SD3)及其增強版本 Stable Diffusion3Turbo。

SD3模型的亮點在于其對字體和提示的遵循能力,這在人類偏好評估中得到了突出體現。為了實現這一目標,SD3采用了新的多模態擴散變換器(MMDiT)架構,該架構改進了對圖像和語言表示的權重分離處理,從而顯著增強了模型的文本理解和拼寫能力。這使得SD3在理解和執行用戶的文本提示時更為精準,生成的圖像更加符合用戶的預期。

Stability AI在不斷提升服務質量,盡管SD3模型已經通過API對外提供,但公司仍在持續對模型進行優化。Stability AI計劃在不久的將來開放模型權重,允許擁有Stability AI會員資格的用戶自行托管,這將增強用戶的自主性和靈活性。

Stability AI與Fireworks AI的合作確保了API平臺的高速和可靠性,公司承諾提供99.9%的服務可用性,這對于企業用戶來說尤為重要,因為他們在使用開發者平臺進行關鍵的生成型AI工作時,需要確保服務的穩定性和可靠性。

至于能不能和 Midjourney v6 相媲美或者超越 V6 ,大家不妨多體驗,試試看!

API文檔:https://top.aibase.com/tool/stable-diffusion-3-api 體驗地址:https://sdxlturbo.ai/stable-diffusion3

4.2k 設計師圍觀了該問題
點贊 13 回答 3

大白(●—●) 邀你回答

2024/04/19

開源大模型 Llama 3 發布,又一 GPT-4 級模型來了,它能干得過 GPT-4 么?

哎呀,昨晚 Meta 發布被稱為最強開源的 Llama 3 系列模型了,大晚上扔了個炸彈啊!說實話,這事兒也不算太意外,畢竟 Meta 總是喜歡搞點大動作。他們這次帶來的就是那個自稱“有史以來最牛”的開源大模型——Llama 3系列。 咱們設計師,又可以借助這個新模型好好發揮一番了!

一起看看這個 GPT-4 級模型,它能干得過 GPT-4 么?

Llama 3模型的特點 - 規模與性能:Meta開源了兩款不同規模的Llama 3模型,分別是8B和70B參數規模。Llama 3 8B在性能上與Llama 2 70B相當,而Llama 3 70B則在性能上媲美甚至超越了其他頂尖AI模型。 - 技術改進:Llama 3在預訓練和后訓練方面都有所改進,優化了模型的一致性和響應多樣性,降低了出錯率。 - 多模態與多語言:未來幾個月,Meta將推出具備多模態、多語言對話和更長上下文窗口的新模型,其中包括超過400B的模型,預計將與現有的頂尖模型競爭。

Llama 3的性能測試 - 基準測試:Llama 3在多個測試中得分超越了其他同類模型,顯示出其在推理、代碼生成和遵循指令等方面的突破性提升。 - 人類評估數據集:Meta開發了一套新的高質量人類評估數據集,用于準確研究模型性能。

開源與閉源的辯論 - 開源優勢:Meta堅定地支持開源路線,認為這有助于推動社區和公司雙方的創新。 - 未來展望:盡管Llama 3為開源模型贏得了一場勝利,但關于開源與閉源的辯論仍在繼續。未來,可能會有更高性能的模型出現,為這場辯論帶來新的轉折。

附上 Llama 3 體驗地址:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct

點贊 20 回答 2

首席爆料師 邀你回答

2024/04/16

Adobe 將 Sora、Runway、Pika 集成在 Premiere Pro 中了,來看看效果實用性怎么樣?

昨晚,Adobe在官網宣布,將OpenAI的Sora、Pika 、Runway等著名第三方文生視頻模型,集成在視頻剪輯軟件Premiere Pro中(簡稱“PR”)。這些集成的模型和功能將通過AI驅動的音頻編輯功能,使得音頻編輯變得更快、更輕松、更直觀。

這次更新是Adobe對PR的一次重大重構,旨在幫助用戶簡化創作流程,并提供多樣化的創作靈感。通過生成式AI的加持,PR將為專業視頻剪輯師和業余愛好者帶來更高效和便捷的創作體驗。

△鼠標右鍵,勾選“顯示控件”,可以打開聲音哦!

用Sora生成視頻素材 Adobe的創新之一是將Sora、Gen-2、Pika以及Firefly系列模型集成到PR中,這將幫助用戶快速為作品添加不同類型的視頻素材和動態效果。例如,用戶只需輸入文本提示“夜雨中的城市風景”,就能通過Sora生成相應的視頻素材,并將其應用在視頻項目中作為背景或增強主軌道視頻。預覽展示表明,用戶一次可以生成三個視頻供選擇。

快速替換、刪除視頻特定區域 Adobe自研的Firefly模型使得替換視頻素材中的特定區域變得輕松。過去,替換素材需要新增一條素材視頻軌道并調整圖層,而現在通過Firefly,用戶只需用鋼筆工具圈選區域并輸入提示文本,如“一大堆寶石”,即可選擇合適的素材進行替換。 此外,Firefly還提供了精準刪除或替換視頻中無用對象的功能。以往需要通過遮蓋、模糊處理等繁瑣方法移除的對象,如垃圾桶或電表箱,現在可以輕松點擊一下快速刪除或替換。

用生成式AI制作定格幀 傳統的視頻定格幀制作流程相對繁瑣,需要找到需要定格的視頻序列,確定并添加幀保持,然后調整定格幀的持續時間。現在,借助生成式AI功能,用戶只需拖動視頻的定格靜態幀,AI將自動生成補充內容,簡化了整個制作過程。 Adobe創意產品部高級副總裁Ashley Still表示,Adobe正在重新構想視頻創作流程的每一個步驟,為創作者提供更高效、便捷的功能。通過將生成式AI深度融合到PR的核心工作流程中,Adobe正在解決視頻編輯人員每天遇到的真正制作痛點,幫助他們節省時間并提升創意靈感。

這些更新和創新展示了Adobe對于AIGC領域的重視和投入,以及其致力于推動多媒體創作工具向前發展的決心。通過集成先進的AI技術,Adobe旨在為創作者提供更加強大和靈活的創作平臺,以激發更多的創意和可能性。

2.5k 設計師圍觀了該問題
點贊 31 回答 3

首席爆料師 邀你回答

2024/04/13

5月15日起谷歌將免費提供3款,生成式AI圖像編輯工具,哪款你最期待?

昨天,谷歌在官網宣布從5月15日起,將向所有谷歌相冊用戶免費提供Magic Editor、Photo Unblur和Magic Eraser三款生成式AI編輯工具。

通過這三款強大的AI圖像編輯工具,用戶可以輕松將模糊的圖片變高清,實現一鍵PS/調色/光影,刪除圖片多余內容等。而在此之前,這三個是谷歌Pixel手機獨有功能。

功能介紹: 1. Magic Editor:這是一款強大的AI圖像編輯工具,它可以幫助用戶輕松實現一鍵PS/調色/光影,改變圖片中的物體位置等。這項功能最初在2023年10月4日隨Pixel 8系列手機發布。Magic Editor的優勢在于它的細節調整和融合度比傳統的PS工具更強,而且操作簡單,無需深度的專業知識。不過,需要注意的是,所有谷歌相冊用戶每月只能使用10次Magic Editor,如果想要更多使用次數,用戶需要購買Pixel 8手機或開通Google One計劃(2TB及以上)。 2. Photo Unblur:這是一款專用于去除圖片模糊的工具。用戶在拍攝圖片時可能會因為手抖、環境等因素導致圖片模糊,Photo Unblur能夠一鍵還原圖片的清晰度,讓模糊的圖片變高清。 3. Magic Eraser:這是一款圖片擦除工具,可以幫助用戶去除照片中不希望出現的元素,如行人或物體。對于不熟悉PS技術的用戶來說,Magic Eraser提供了一種簡單快捷的解決方案,一鍵完美去除圖片中的障礙物。

哪款你最期待呢?評論區說出你的想法吧~

2.2k 設計師圍觀了該問題
點贊 33 回答 3

大白(●—●) 邀你回答

2024/04/10

一鍵自動寫影評,谷歌重磅發布Gemini 1.5 Pro,功能太強大了吧?

4月10日凌晨,谷歌在官網正式發布了Gemini1.5Pro,現在可在180多個國家/地區使用。

Gemini 1.5 Pro 不僅能夠生成創意文本和代碼,還能理解、總結上傳的視頻和音頻內容,并且支持高達100萬tokens的上下文。

在Google AI Studio開發平臺中,用戶可以免費試用Gemini 1.5 Pro,并且它支持中文提示。這使得用戶能夠通過簡單的操作,上傳視頻或音頻文件,并獲取內容的深度總結。例如,用戶可以上傳一個視頻并詢問影片的內容,Gemini 1.5 Pro能夠快速解析并提供答案。

Gemini 1.5 Pro還提供了音頻理解功能,能夠快速解析音頻文件并總結其內容。這對于需要處理大量視頻和音頻內容的用戶來說,無疑是一個巨大的幫助,因為它可以節省大量的時間。

谷歌還對Gemini API進行了性能優化,包括系統指令、JSON模式以及函數調用優化,這些改進顯著提升了模型的穩定性和輸出能力。系統指令功能允許用戶根據特定需求控制模型的行為,JSON模式可以幫助開發者從文本或圖像中提取結構化數據,而函數調用優化則支持開發者實現更全面的查詢響應。

詳情點此查看: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音頻理解能力: https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

點贊 17 回答 3

128位高手大咖在線答疑解惑

說清楚

完整的描述具體問題和細節

1

耐心等

回答問題需要認真思考,請耐心等待

2

巧咨詢

還有疑問?及時追問獲取更多答案

3
我要提問