華爾街剛經歴DeepSeek之夜的洗禮後,這家中國人工智能初創又發布新的模型,衝擊閉源的圖像生成模型。
內地傳媒引述AI社區網站Hugging Face指,DeepSeek發布了分別名為Janus-Pro和JanusFlow的一系列開源多模態AI模型,參數從10億到70億不等,已可在Hugging Face下載。其中,70億參數的Janus-Pro-7B在基準測試中,擊敗OpenAI 的DALL-E 3和Stable Diffusion模型。
DeepSeek指,Janus-Pro和JanusFlow的代碼基於MIT許可證授權,這意味著它們可以不受限地用於商業用途。Janus-Pro超越之前的統一模型,並達到或超過特定任務模型的性能。Janus-Pro 的簡單、高靈活性和有效性,使它成為下一代統一多模式模型的有力候選者。
廣告(請繼續閱讀本文)
另外,阿里雲通義千問開源全新的視覺模型Qwen2.5-VL,奪得十多項權威評測中的視覺理解冠軍,超越GPT-4o與Claude3.5。新的Qwen2.5-VL能夠更準確地解析圖像內容,支持超過1小時的視頻理解,毋須微調就可變身為一個能操控手機和電腦的AI視覺智能體(Visual Agents),實現給指定朋友送祝福、電腦修圖、手機訂票等多步複雜操作。
廣告(請繼續閱讀本文)