网联自动驾驶车辆(Connected and Automated Vehicle, CAV)为快速路匝道合流控制提供了更高效且精准的控制方案,可看作“流中之粒”。然而,在人工驾驶车辆与CAV混行环境下,基于单车智能路线的合流控制方法仍面临感知范围受限和泛化难的问题。为此,提出一种车路协同环境(Cooperative Vehicle-Infrastructure System,CVIS)下泛化增强的强化学习匝道合流控制方法。首先,通过CVIS的路侧单元向CAV提供周围车辆和交通流的信息,拓展感知范围,确保CAV能够获取统一状态特征以支撑模型的泛化性。其次,设计了一种通用的状态表征方法,可适用于不同车道、CAV渗透率和车辆数量的合流场景。该状态设计能够让强化学习智能体实现参数共享,有效提升模型的泛化性。为了同时优化个体CAV状态与合流区整体效率,奖励函数综合考虑了车辆安全、效率、动作执行效果以及对周围车辆速度的影响。采用双重深度Q网络(Double Deep Q-network, DDQN)算法对智能体进行训练,结合分布式控制架构降低计算复杂度并增强泛化性。此外,通过优先经验回放和软更新策略进一步提升算法训练速度与稳定性。将车路协同场景下的DDQN模型(DDQN-CVIS)分别与单车智能环境下的动机决策树模型(CIDT-CAV)和DDQN模型(DDQN-CAV)进行对比。结果表明,在DDQN-CVIS模型下:①车路协同环境中全面信息的获取减少了车辆盲区,大部分匝道车辆换道位置前移,合流区得到更高效利用;②主线车辆能够主动为匝道车辆让出换道间隙,形成换道协作;③该方法在不同CAV渗透率、动态CAV渗透率以及多种交通需求场景下均表现优异,尤其在高需求场景下,平均车速提升11.13%,平均流量增加3.98%。以上结果验证了该方法在复杂合流场景中对交通流和单车效益平衡与优化的可行性,进一步实现“粒流协同”新型交通管控范式。