• 学院内网
搜索
返回主站
English
  • 学院概况
    • 概览
    • 学科方向
    • 院长致辞
    • 学院刊物
      • 宣传手册
      • 季度简报
      • 年报
    • 常见问题
    • 联系我们
  • 项目设置
    • 简介
    • 本科生
      • 数据科学与大数据技术
      • 统计学
      • 计算机科学与技术
      • 金融工程
      • 2+2双主修
        • 跨学科数据分析 + X 双主修课程
        • 航天科学与地球信息学 + X 双主修课程
      • 哥伦比亚大学工程学院3+2直硕项目(哥大班)
    • 硕士研究生
      • 数据科学理学硕士
      • 金融工程理学硕士(全日/兼读制)
      • 人工智能与机器人理学硕士
      • 计算机科学理学硕士
      • 统计学理学硕士
      • 生物信息学理学硕士
    • 博士研究生(哲学硕士)
      • 数据科学哲学硕士-博士
      • 计算机科学哲学硕士-博士
  • 师资力量
    • 教职人员
    • 荣休教授
    • 兼职人员
    • 科研/访问人员
    • “数说名师”教授访谈
  • SDS学生
    • 本科生学业咨询系统
    • 博士生
    • 学生访谈
  • 新闻与公示
    • 新闻
    • 公示
  • 学院活动
    • 学术会议
      • DDTOR 2025
      • CSAMSE 2023
      • RMTA 2023
      • ICASSP 2022
      • Mostly OM 2019
    • 学术活动
    • 数据科学名家讲坛
    • 其他活动
  • 学术科研
  • 人才招聘
    • 教职人员
    • 博士后
  • 职业发展
    • 升学就业
    • 国际交流
  • 学院概况
    • 概览
    • 学科方向
    • 院长致辞
    • 学院刊物
      • 宣传手册
      • 季度简报
      • 年报
    • 常见问题
    • 联系我们
  • 项目设置
    • 简介
    • 本科生
      • 数据科学与大数据技术
      • 统计学
      • 计算机科学与技术
      • 金融工程
      • 2+2双主修
        • 跨学科数据分析 + X 双主修课程
        • 航天科学与地球信息学 + X 双主修课程
      • 哥伦比亚大学工程学院3+2直硕项目(哥大班)
    • 硕士研究生
      • 数据科学理学硕士
      • 金融工程理学硕士(全日/兼读制)
      • 人工智能与机器人理学硕士
      • 计算机科学理学硕士
      • 统计学理学硕士
      • 生物信息学理学硕士
    • 博士研究生(哲学硕士)
      • 数据科学哲学硕士-博士
      • 计算机科学哲学硕士-博士
  • 师资力量
    • 教职人员
    • 荣休教授
    • 兼职人员
    • 科研/访问人员
    • “数说名师”教授访谈
  • SDS学生
    • 本科生学业咨询系统
    • 博士生
    • 学生访谈
  • 新闻与公示
    • 新闻
    • 公示
  • 学院活动
    • 学术会议
      • DDTOR 2025
      • CSAMSE 2023
      • RMTA 2023
      • ICASSP 2022
      • Mostly OM 2019
    • 学术活动
    • 数据科学名家讲坛
    • 其他活动
  • 学术科研
  • 人才招聘
    • 教职人员
    • 博士后
  • 职业发展
    • 升学就业
    • 国际交流
  • 学院内网
返回主站
English

面包屑

  • 首页
  • 学院活动
  • 数据科学名家讲坛
  • 【数据科学名家讲坛】On the Value Functions in Reinforcement Learning for Ridesharing - With an Introduction to Operations Research in Industry (Zhiwei (Tony) QIN, Principal Scientist, Lyft)

【数据科学名家讲坛】On the Value Functions in Reinforcement Learning for Ridesharing - With an Introduction to Operations Research in Industry (Zhiwei (Tony) QIN, Principal Scientist, Lyft)

2023-08-29 数据科学名家讲坛

主题:On the Value Functions in Reinforcement Learning for Ridesharing - With an Introduction to Operations Research in Industry

报告人:Zhiwei (Tony) QIN, Principal Scientist, Lyft

主持人:Jim DAI, Dean, School of Data Science, CUHK-Shenzhen

日期:August 29 (Tuesday), 2023

时间:16:00 - 17:00, Beijing Time

形式:Offline

地点:205 Meeting Room, ABE

语言:English

摘要:

We will first introduce the applications of operations research in a few key industry domains (e.g., ridesharing, supply chain, delivery), describing the real-world problems and potential OR solutions. We will then turn our attention to sequential decision problems, to which reinforcement learning is a core family of methodologies.

A focal point of reinforcement learning for ridesharing is the value function learning. In this talk, we will recapitulate the RL methods based on offline learning, and then talk about recently deployed works in the domain that shift toward online on-policy updates. We will discuss reward representation in this two-sided marketplace and demonstrate how shared value functions can be adopted to coordinate multiple rideshare levers. Finally, we will discuss learning the value functions for individual market participating units (both supply and demand) while making sure that they collectively approximate the system values well.

简介:

Zhiwei (Tony) Qin is Principal Scientist at Lyft, working on core problems in ridesharing marketplace optimization. Previously, he was Principal Research Scientist and Director of the Decision Intelligence group at DiDi AI Labs and Staff Scientist in supply chain and inventory optimization at Walmart Global E-commerce. Tony received his Ph.D. in Operations Research from Columbia University. His research interests span optimization and machine learning, with a particular focus in reinforcement learning and its applications in operational optimization, digital marketing, and smart transportation. He is Associate Editor of the ACM Journal on Autonomous Transportation Systems. He has published more than 40 papers in top-tier conferences and journals in machine learning and optimization. He has served as Area Chair/Senior PC of KDD, AAAI, and ECML-PKDD, and a referee of top journals.  He is an INFORMS Franz Edelman Award Finalist and Laureate in 2023, received the INFORMS Daniel H. Wagner Prize for Excellence in Operations Research Practice in 2019 and was selected for the NeurIPS 2018 Best Demo Awards.  Tony holds more than 10 US patents in intelligent transportation, supply chain, and recommendation systems.

地址: 广东省深圳市龙岗区龙翔大道2001号道远楼3-6楼
邮箱: sds@cuhk.edu.cn
微信公众号: cuhksz-sds

sds.cuhk.edu.cn

版权所有 © 香港中文大学(深圳)数据科学学院