arXiv preprint arXiv:2405.06836 , year=

Ahmed, S · 2024 · arXiv 2405.06836

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Self-Improving Tabular Language Models via Iterative Reward-Guided Post-Training

cs.LG · 2026-04-21 · unverdicted · novelty 5.0

TabGRAA applies group-relative advantage alignment in an iterative reward-guided post-training loop to improve tabular language model generators on fidelity, utility, and privacy trade-offs across five benchmarks.

SmileyLlama: Modifying Large Language Models for Directed Chemical Space Exploration

physics.chem-ph · 2024-09-03 · unverdicted · novelty 4.0

SmileyLlama is an LLM transformed via SFT and DPO to generate valid novel drug-like molecules with user-specified properties and optimized 3D conformations for high binding affinity.

citing papers explorer

Showing 2 of 2 citing papers.

Self-Improving Tabular Language Models via Iterative Reward-Guided Post-Training cs.LG · 2026-04-21 · unverdicted · none · ref 213
TabGRAA applies group-relative advantage alignment in an iterative reward-guided post-training loop to improve tabular language model generators on fidelity, utility, and privacy trade-offs across five benchmarks.
SmileyLlama: Modifying Large Language Models for Directed Chemical Space Exploration physics.chem-ph · 2024-09-03 · unverdicted · none · ref 38
SmileyLlama is an LLM transformed via SFT and DPO to generate valid novel drug-like molecules with user-specified properties and optimized 3D conformations for high binding affinity.

arXiv preprint arXiv:2405.06836 , year=

fields

years

verdicts

representative citing papers

citing papers explorer