Language models are unsupervised multitask learners.OpenAI Blog

Alec Radford et al · 2019

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Please Make it Sound like Human: Encoder-Decoder vs. Decoder-Only Transformers for AI-to-Human Text Style Transfer

cs.CL · 2026-04-13 · unverdicted · novelty 5.0

BART-large outperforms Mistral-7B in AI-to-human style transfer with higher reference similarity scores and far fewer parameters, while showing that marker shift can reflect overshoot rather than accurate transfer.

Measuring and Mitigating Toxicity in Large Language Models: A Comprehensive Replication Study

cs.CL · 2026-05-13 · conditional · novelty 2.0 · 2 refs

DExperts reaches 100% safety on explicit toxicity benchmarks but only 98.5% on implicit hate speech from ToxiGen while imposing a 10x latency increase on GPT-2.

citing papers explorer

Showing 2 of 2 citing papers.

Please Make it Sound like Human: Encoder-Decoder vs. Decoder-Only Transformers for AI-to-Human Text Style Transfer cs.CL · 2026-04-13 · unverdicted · none · ref 10
BART-large outperforms Mistral-7B in AI-to-human style transfer with higher reference similarity scores and far fewer parameters, while showing that marker shift can reflect overshoot rather than accurate transfer.
Measuring and Mitigating Toxicity in Large Language Models: A Comprehensive Replication Study cs.CL · 2026-05-13 · conditional · none · ref 2 · 2 links
DExperts reaches 100% safety on explicit toxicity benchmarks but only 98.5% on implicit hate speech from ToxiGen while imposing a 10x latency increase on GPT-2.

Language models are unsupervised multitask learners.OpenAI Blog

fields

years

verdicts

representative citing papers

citing papers explorer