Can we start generating the program and executing it before the user even finishes the utterance so that the faster response can be achieved by the system?

Training runs for up to 8k steps in Stage 1, 2k steps in Stage 2

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech

cs.CL · 2026-04-22 · unverdicted · novelty 6.0

Hierarchical Policy Optimization post-trains LLMs for simultaneous speech translation on imperfect data, yielding over +7 COMET and +1.25 MetricX improvements at 1.5-second latency on English-to-Chinese/German/Japanese tasks.

citing papers explorer

Showing 1 of 1 citing paper.

Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech cs.CL · 2026-04-22 · unverdicted · none · ref 10
Hierarchical Policy Optimization post-trains LLMs for simultaneous speech translation on imperfect data, yielding over +7 COMET and +1.25 MetricX improvements at 1.5-second latency on English-to-Chinese/German/Japanese tasks.

Can we start generating the program and executing it before the user even finishes the utterance so that the faster response can be achieved by the system?

fields

years

verdicts

representative citing papers

citing papers explorer