Skip to content
Go back

PACEvolve

Edit page

已有方法的问题

Context Pollution

出现不好的结果,存在context里后会污染context,导致LLM持续陷入不好的假设

Exploration - Exploitation balance不好

模型倾向于选择和过去经验context中类似的方法,导致不能很好explore创新性的想法

Weak Collaboration hurts parallel search efficiency

使用类似multi-island的算法,只在固定的时间将差的个体替换成最好的个体的复制,没有充分利用不同island之间的知识多样性

解决方法

Hierarchical Context Management (HCM)

分离 high-level 的 idea 和具体的解决方法

使用两阶段的过程:

  1. idea生成,此阶段将生成的idea使用一个LLM-based classifier决定是用来refine现有的data,或者存成新的entry
  2. idea选择

两个层次的Context Pruning

  1. 在hypothesis-level,压缩相关实验的history
  2. 在ideal-level,干掉有大量low-performing hypotheses的idea

Persisting Failures to Permanent Memory

记录失败,引以为戒

动量回溯机制 (Momentum-Based Backtracking, MBB)

核心目的:解决进化搜索中的“模式崩溃(Mode Collapse)”和局部最优问题,取代低效的固定频率重启(Fixed-schedule Resets)。

自适应协作进化 (Self-Adaptive Collaborative Evolution, CE)

核心目的:在多岛屿(Multi-island)并行搜索中,动态平衡“内部探索”与“外部利用”,通过 LLM 自适应地决定知识迁移。


Edit page
Share this post on:

Previous Post
Complementary RL
Next Post
MemGen