Daily Paper Cast | All Episodes

DI-PCG: Diffusion-based Efficient Inverse Procedural Content Generation for High-quality 3D Asset Creation

Episode 253 · December 20, 2024 · 23:08

🤗 Upvotes: 8 | cs.CV, cs.AI, cs.GR Authors: Wang Zhao, Yan-Pei Cao, Jiale Xu, Yuejiang Dong, Ying Shan Title: DI-PCG: D...

AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling

Episode 252 · December 20, 2024 · 24:09

🤗 Upvotes: 7 | cs.CL, cs.AI, cs.LG Authors: Zihan Liu, Yang Chen, Mohammad Shoeybi, Bryan Catanzaro, Wei Ping Title: Ac...

No More Adam: Learning Rate Scaling at Initialization is All You Need

Episode 251 · December 19, 2024 · 21:59

🤗 Upvotes: 177 | cs.LG, cs.AI Authors: Minghao Xu, Lichuan Xiang, Xu Cai, Hongkai Wen Title: No More Adam: Learning Rat...

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Episode 250 · December 19, 2024 · 21:56

🤗 Upvotes: 36 | cs.CL, cs.AI Authors: Benjamin Warner, Antoine Chaffin, Benjamin Clavié, Orion Weller, Oskar Hallström, Said Taghadouini, Alexis...

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

Episode 249 · December 19, 2024 · 24:45

🤗 Upvotes: 30 | cs.CL Authors: Frank F. Xu, Yufan Song, Boxuan Li, Yuxuan Tang, Kritanjali Jain, Mengxue Bao, Zora Z. Wang, Xuhui Zhou, Zhitong ...

AniDoc: Animation Creation Made Easier

Episode 248 · December 19, 2024 · 22:20

🤗 Upvotes: 29 | cs.CV Authors: Yihao Meng, Hao Ouyang, Hanlin Wang, Qiuyu Wang, Wen Wang, Ka Leong Cheng, Zhiheng Liu, Yujun Shen, Huamin Qu ...

FashionComposer: Compositional Fashion Image Generation

Episode 247 · December 19, 2024 · 19:47

🤗 Upvotes: 13 | cs.CV Authors: Sihui Ji, Yiyang Wang, Xi Chen, Xiaogang Xu, Hao Luo, Hengshuang Zhao Title: FashionComp...

GUI Agents: A Survey

Episode 246 · December 19, 2024 · 21:01

🤗 Upvotes: 11 | cs.AI, cs.HC Authors: Dang Nguyen, Jian Chen, Yu Wang, Gang Wu, Namyong Park, Zhengmian Hu, Hanjia Lyu, Junda Wu, Ryan Aponte, Y...

Efficient Diffusion Transformer Policies with Mixture of Expert Denoisers for Multitask Learning

Episode 245 · December 19, 2024 · 22:42

🤗 Upvotes: 10 | cs.LG, cs.RO Authors: Moritz Reuss, Jyothish Pari, Pulkit Agrawal, Rudolf Lioutikov Title: Efficient Di...

Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation

Episode 244 · December 19, 2024 · 20:41

🤗 Upvotes: 10 | cs.CV Authors: Haotong Lin, Sida Peng, Jingxiao Chen, Songyou Peng, Jiaming Sun, Minghuan Liu, Hujun Bao, Jiashi Feng, Xiaowei Z...

Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces

Episode 243 · December 19, 2024 · 20:52

🤗 Upvotes: 9 | cs.CV Authors: Jihan Yang, Shusheng Yang, Anjali W. Gupta, Rilyn Han, Li Fei-Fei, Saining Xie Title: Thi...

Are Your LLMs Capable of Stable Reasoning?

Episode 242 · December 18, 2024 · 24:11

🤗 Upvotes: 61 | cs.AI, cs.CL Authors: Junnan Liu, Hongwei Liu, Linchen Xiao, Ziyi Wang, Kuikun Liu, Songyang Gao, Wenwei Zhang, Songyang Zhang, ...

Multi-Dimensional Insights: Benchmarking Real-World Personalization in Large Multimodal Models

Episode 241 · December 18, 2024 · 22:34

🤗 Upvotes: 29 | cs.AI, cs.CL, cs.CV Authors: YiFan Zhang, Shanglin Lei, Runqi Qiao, Zhuoma GongQue, Xiaoshuai Song, Guanting Dong, Qiuna Tan, Zh...

OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain

Episode 240 · December 18, 2024 · 23:15

🤗 Upvotes: 29 | cs.CL Authors: Shuting Wang, Jiejun Tan, Zhicheng Dou, Ji-Rong Wen Title: OmniEval: An Omnidirectional ...

Compressed Chain of Thought: Efficient Reasoning Through Dense Representations

Episode 239 · December 18, 2024 · 23:05

🤗 Upvotes: 21 | cs.CL Authors: Jeffrey Cheng, Benjamin Van Durme Title: Compressed Chain of Thought: Efficient Reasonin...

Emergence of Abstractions: Concept Encoding and Decoding Mechanism for In-Context Learning in Transformers

Episode 238 · December 18, 2024 · 22:52

🤗 Upvotes: 9 | cs.CL, cs.AI, cs.LG Authors: Seungwook Han, Jinyeop Song, Jeff Gore, Pulkit Agrawal Title: Emergence of ...

Feather the Throttle: Revisiting Visual Token Pruning for Vision-Language Model Acceleration

Episode 237 · December 18, 2024 · 20:44

🤗 Upvotes: 7 | cs.CV Authors: Mark Endo, Xiaohan Wang, Serena Yeung-Levy Title: Feather the Throttle: Revisiting Visual...

Proposer-Agent-Evaluator(PAE): Autonomous Skill Discovery For Foundation Model Internet Agents

Episode 236 · December 18, 2024 · 23:53

🤗 Upvotes: 5 | cs.LG, cs.AI, cs.CV Authors: Yifei Zhou, Qianlan Yang, Kaixiang Lin, Min Bai, Xiong Zhou, Yu-Xiong Wang, Sergey Levine, Erran Li ...

VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation

Episode 235 · December 18, 2024 · 23:12

🤗 Upvotes: 4 | cs.CL Authors: Manan Suri, Puneet Mathur, Franck Dernoncourt, Kanika Goswami, Ryan A. Rossi, Dinesh Manocha Title: ...

SUGAR: Subject-Driven Video Customization in a Zero-Shot Manner

Episode 234 · December 18, 2024 · 20:27

🤗 Upvotes: 2 | cs.CV Authors: Yufan Zhou, Ruiyi Zhang, Jiuxiang Gu, Nanxuan Zhao, Jing Shi, Tong Sun Title: SUGAR: Subj...

Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion

Episode 233 · December 18, 2024 · 20:33

🤗 Upvotes: 2 | cs.CV, cs.LG Authors: Massimiliano Viola, Kevin Qu, Nando Metzger, Bingxin Ke, Alexander Becker, Konrad Schindler, Anton Obukhov ...

Byte Latent Transformer: Patches Scale Better Than Tokens

Episode 232 · December 17, 2024 · 25:08

🤗 Upvotes: 39 | cs.CL Authors: Artidoro Pagnoni, Ram Pasunuru, Pedro Rodriguez, John Nguyen, Benjamin Muller, Margaret Li, Chunting Zhou, Lili Y...

RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation

Episode 231 · December 17, 2024 · 21:46

🤗 Upvotes: 25 | cs.CL, cs.AI, cs.IR Authors: Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yongkang Wu, Zhonghua Li, Qi Ye, Zhicheng Dou Title...

Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models

Episode 230 · December 17, 2024 · 21:10

🤗 Upvotes: 25 | cs.CV, cs.AI, cs.CL Authors: Fan Zhang, Shulin Tian, Ziqi Huang, Yu Qiao, Ziwei Liu Title: Evaluation A...

BrushEdit: All-In-One Image Inpainting and Editing

Episode 229 · December 17, 2024 · 27:48

🤗 Upvotes: 24 | cs.CV, cs.AI Authors: Yaowei Li, Yuxuan Bian, Xuan Ju, Zhaoyang Zhang, Ying Shan, Yuexian Zou, Qiang Xu Title: ...

ColorFlow: Retrieval-Augmented Image Sequence Colorization

Episode 228 · December 17, 2024 · 22:32

🤗 Upvotes: 20 | cs.CV Authors: Junhao Zhuang, Xuan Ju, Zhaoyang Zhang, Yong Liu, Shiyi Zhang, Chun Yuan, Ying Shan Title: ...

Smaller Language Models Are Better Instruction Evolvers

Episode 227 · December 17, 2024 · 23:17

🤗 Upvotes: 16 | cs.CL Authors: Tingfeng Hui, Lulu Zhao, Guanting Dong, Yaqi Zhang, Hua Zhou, Sen Su Title: Smaller Lang...

Causal Diffusion Transformers for Generative Modeling

Episode 226 · December 17, 2024 · 23:47

🤗 Upvotes: 16 | cs.CV Authors: Chaorui Deng, Deyao Zhu, Kunchang Li, Shi Guang, Haoqi Fan Title: Causal Diffusion Trans...

SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models

Episode 225 · December 17, 2024 · 23:05

🤗 Upvotes: 11 | cs.CL, cs.AI, cs.LG Authors: Jiale Cheng, Xiao Liu, Cunxiang Wang, Xiaotao Gu, Yida Lu, Dan Zhang, Yuxiao Dong, Jie Tang, Hongni...

IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations

Episode 224 · December 17, 2024 · 20:29

🤗 Upvotes: 11 | cs.CV Authors: Zhibing Li, Tong Wu, Jing Tan, Mengchen Zhang, Jiaqi Wang, Dahua Lin Title: IDArb: Intri...