Daily Paper Cast | All Episodes

Web-Shepherd: Advancing PRMs for Reinforcing Web Agents

Episode 787 · May 22, 2025 · 22:49

🤗 Upvotes: 80 | cs.CL Authors: Hyungjoo Chae, Sunghwan Kim, Junhee Cho, Seungone Kim, Seungjun Moon, Gyeom Hwangbo, Dongha Lim, Minjin Kim, Yeon...

MMaDA: Multimodal Large Diffusion Language Models

Episode 786 · May 22, 2025 · 21:00

🤗 Upvotes: 56 | cs.CV Authors: Ling Yang, Ye Tian, Bowen Li, Xinchen Zhang, Ke Shen, Yunhai Tong, Mengdi Wang Title: MM...

Scaling Law for Quantization-Aware Training

Episode 785 · May 22, 2025 · 19:44

🤗 Upvotes: 56 | cs.LG, cs.CL Authors: Mengzhao Chen, Chaoyi Zhang, Jing Liu, Yutao Zeng, Zeyue Xue, Zhiheng Liu, Yunshui Li, Jin Ma, Jie Huang, ...

UniVG-R1: Reasoning Guided Universal Visual Grounding with Reinforcement Learning

Episode 784 · May 22, 2025 · 18:15

🤗 Upvotes: 43 | cs.CV Authors: Sule Bai, Mingxing Li, Yong Liu, Jing Tang, Haoji Zhang, Lei Sun, Xiangxiang Chu, Yansong Tang Title...

Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective

Episode 783 · May 22, 2025 · 20:47

🤗 Upvotes: 41 | cs.CL Authors: Siyue Zhang, Yilun Zhao, Liyuan Geng, Arman Cohan, Anh Tuan Luu, Chen Zhao Title: Diffus...

Efficient Agent Training for Computer Use

Episode 782 · May 22, 2025 · 23:07

🤗 Upvotes: 32 | cs.AI, cs.CL, cs.LG Authors: Yanheng He, Jiahe Jin, Pengfei Liu Title: Efficient Agent Training for Com...

This Time is Different: An Observability Perspective on Time Series Foundation Models

Episode 781 · May 22, 2025 · 22:05

🤗 Upvotes: 28 | cs.LG, cs.AI Authors: Ben Cohen, Emaad Khwaja, Youssef Doubli, Salahidine Lemaachi, Chris Lettieri, Charles Masson, Hugo Miccini...

Learn to Reason Efficiently with Adaptive Length-based Reward Shaping

Episode 780 · May 22, 2025 · 17:46

🤗 Upvotes: 24 | cs.CL, cs.AI, cs.LG Authors: Wei Liu, Ruochen Zhou, Yiyun Deng, Yuzhen Huang, Junteng Liu, Yuntian Deng, Yizhe Zhang, Junxian He...

Emerging Properties in Unified Multimodal Pretraining

Episode 779 · May 21, 2025 · 22:46

🤗 Upvotes: 87 | cs.CV Authors: Chaorui Deng, Deyao Zhu, Kunchang Li, Chenhui Gou, Feng Li, Zeyu Wang, Shu Zhong, Weihao Yu, Xiaonan Nie, Ziang S...

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

Episode 778 · May 21, 2025 · 21:11

🤗 Upvotes: 48 | cs.LG, cs.AI, cs.AR, cs.CV, cs.PF Authors: Jintao Zhang, Jia Wei, Pengle Zhang, Xiaoming Xu, Haofeng Huang, Haoxu Wang, Kai Jian...

Optimizing Anytime Reasoning via Budget Relative Policy Optimization

Episode 777 · May 21, 2025 · 21:59

🤗 Upvotes: 30 | cs.LG, cs.AI, cs.CL Authors: Penghui Qi, Zichen Liu, Tianyu Pang, Chao Du, Wee Sun Lee, Min Lin Title: ...

VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank

Episode 776 · May 21, 2025 · 20:39

🤗 Upvotes: 28 | cs.CV Authors: Tianhe Wu, Jian Zou, Jie Liang, Lei Zhang, Kede Ma Title: VisualQuality-R1: Reasoning-In...

Visual Agentic Reinforcement Fine-Tuning

Episode 775 · May 21, 2025 · 23:31

🤗 Upvotes: 26 | cs.CV, cs.AI Authors: Ziyu Liu, Yuhang Zang, Yushan Zou, Zijian Liang, Xiaoyi Dong, Yuhang Cao, Haodong Duan, Dahua Lin, Jiaqi W...

Neurosymbolic Diffusion Models

Episode 774 · May 21, 2025 · 23:44

🤗 Upvotes: 25 | cs.LG Authors: Emile van Krieken, Pasquale Minervini, Edoardo Ponti, Antonio Vergari Title: Neurosymbol...

Chain-of-Model Learning for Language Model

Episode 773 · May 20, 2025 · 23:37

🤗 Upvotes: 70 | cs.CL Authors: Kaitao Song, Xiaohua Wang, Xu Tan, Huiqiang Jiang, Chengruidong Zhang, Yongliang Shen, Cen LU, Zihao Li, Zifan So...

AdaptThink: Reasoning Models Can Learn When to Think

Episode 772 · May 20, 2025 · 20:31

🤗 Upvotes: 58 | cs.CL, cs.AI, cs.LG Authors: Jiajie Zhang, Nianyi Lin, Lei Hou, Ling Feng, Juanzi Li Title: AdaptThink:...

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Episode 771 · May 20, 2025 · 20:57

🤗 Upvotes: 46 | cs.LG, cs.AI Authors: Chenwei Lou, Zewei Sun, Xinnian Liang, Meng Qu, Wei Shen, Wenqi Wang, Yuntao Li, Qingping Yang, Shuangzhi ...

Delta Attention: Fast and Accurate Sparse Attention Inference by Delta Correction

Episode 770 · May 20, 2025 · 20:30

🤗 Upvotes: 39 | cs.LG Authors: Jeffrey Willette, Heejun Lee, Sung Ju Hwang Title: Delta Attention: Fast and Accurate Sp...

Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis

Episode 769 · May 20, 2025 · 22:05

🤗 Upvotes: 34 | cs.AI, cs.CL, cs.CV, cs.HC Authors: Tianbao Xie, Jiaqi Deng, Xiaochuan Li, Junlin Yang, Haoyuan Wu, Jixuan Chen, Wenjing Hu, Xin...

Faster Video Diffusion with Trainable Sparse Attention

Episode 768 · May 20, 2025 · 25:40

🤗 Upvotes: 29 | cs.CV Authors: Peiyuan Zhang, Haofeng Huang, Yongqi Chen, Will Lin, Zhengzhong Liu, Ion Stoica, Eric P. Xing, Hao Zhang ...

Thinkless: LLM Learns When to Think

Episode 767 · May 20, 2025 · 17:59

🤗 Upvotes: 28 | cs.CL, cs.AI Authors: Gongfan Fang, Xinyin Ma, Xinchao Wang Title: Thinkless: LLM Learns When to Think ...

Model Merging in Pre-training of Large Language Models

Episode 766 · May 20, 2025 · 23:02

🤗 Upvotes: 27 | cs.CL, cs.LG Authors: Yunshui Li, Yiyuan Ma, Shen Yan, Chaoyi Zhang, Jing Liu, Jianqiao Lu, Ziwen Xu, Mengzhao Chen, Minrui Wang...

Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space

Episode 765 · May 20, 2025 · 24:52

🤗 Upvotes: 23 | cs.LG, cs.AI, cs.CL Authors: Hengli Li, Chenxi Li, Tong Wu, Xuekai Zhu, Yuxuan Wang, Zhaoxin Yu, Eric Hanchen Jiang, Song-Chun Z...

Qwen3 Technical Report

Episode 764 · May 19, 2025 · 21:31

🤗 Upvotes: 117 | cs.CL Authors: An Yang, Anfeng Li, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu, Chang Gao, Chengen Huang, Chen...

GuardReasoner-VL: Safeguarding VLMs via Reinforced Reasoning

Episode 763 · May 19, 2025 · 23:50

🤗 Upvotes: 43 | cs.AI, cs.CR Authors: Yue Liu, Shengfang Zhai, Mingzhe Du, Yulin Chen, Tri Cao, Hongcheng Gao, Cheng Wang, Xinfeng Li, Kun Wang,...

MMLongBench: Benchmarking Long-Context Vision-Language Models Effectively and Thoroughly

Episode 762 · May 19, 2025 · 19:26

🤗 Upvotes: 42 | cs.CV, cs.CL Authors: Zhaowei Wang, Wenhao Yu, Xiyu Ren, Jipeng Zhang, Yu Zhao, Rohit Saxena, Liang Cheng, Ginny Wong, Simon See...

Visual Planning: Let's Think Only with Images

Episode 761 · May 19, 2025 · 21:56

🤗 Upvotes: 33 | cs.LG, cs.AI, cs.CL, cs.CV Authors: Yi Xu, Chengzu Li, Han Zhou, Xingchen Wan, Caiqi Zhang, Anna Korhonen, Ivan Vulić ...

Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

Episode 760 · May 16, 2025 · 21:52

🤗 Upvotes: 76 | cs.CL Authors: Zhiyuan Hu, Yibo Wang, Hanze Dong, Yuhui Xu, Amrita Saha, Caiming Xiong, Bryan Hooi, Junnan Li Title...

System Prompt Optimization with Meta-Learning

Episode 759 · May 16, 2025 · 21:40

🤗 Upvotes: 48 | cs.CL, cs.AI, cs.LG Authors: Yumin Choi, Jinheon Baek, Sung Ju Hwang Title: System Prompt Optimization ...

BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset

Episode 758 · May 15, 2025 · 19:27

🤗 Upvotes: 49 | cs.CV, cs.AI Authors: Jiuhai Chen, Zhiyang Xu, Xichen Pan, Yushi Hu, Can Qin, Tom Goldstein, Lifu Huang, Tianyi Zhou, Saining Xi...