Global PIQA: Evaluating Commonsense Reasoning Across 100+ Languages and Cultures

Abdelrahman Eldesokey; Abdelrahman Sadallah; Abeer Kashar; Abolade Daud; Abosede Grace Olanihun; Adamu Labaran Mohammed; Adeyemi Praise; Adhikarimayum Meerajita Sharma; Aditi Gupta; Adril Putra Merin

arxiv: 2510.24081 · v2 · pith:R7CQ6SGUnew · submitted 2025-10-28 · 💻 cs.CL

Global PIQA: Evaluating Commonsense Reasoning Across 100+ Languages and Cultures

Tyler A. Chang , Catherine Arnett , Abdelrahman Sadallah , Abdelrahman Eldesokey , Abeer Kashar , Abolade Daud , Abosede Grace Olanihun , Adamu Labaran Mohammed

show 372 more authors

Adeyemi Praise Adhikarimayum Meerajita Sharma Aditi Gupta Adril Putra Merin Adwoa Bremang Afitab Iyigun Afonso Simpl\'icio Ahmed Essouaied Aicha Chorana Akhil Eppa Akintunde Oladipo Akriti Kuri Akshay Ramesh Aleksei Dorkin Alfred Malengo Kondoro Alham Fikri Aji Ali Eren \c{C}etinta\c{s} Allan Hanbury Alou Dembele Alp Niksarli \'Alvaro Arroyo Amin Bajand Amol Khanna Ana Chkhaidze Ana Carolina Condez Anamaria-Roberta Hartl Andiswa Mkhonto Andrew Hoblitzell Andrew Tran Angelos Poulis Anirban Majumder Anjali Chaudhary Anna Vacalopoulou Annette Kuuipolani Kanahele Wong Annika Simonsen Anton Kovalev Anupam Nayak Ashvanth S Ayodeji Lana Ayu Purwarianti Bashar Alhafni Benedict Busole Bernard Ghanem Bharti Nathani Biljana Stojanovska {\DJ}uri\'c Blessing Ogundipe Bolaotan Agbonile Bragi Bergsson Bruce Torres Fischer Burak Tutar Burcu \c{C}{\i}nar Cade Kane Can Udomcharoenchaikit Chadi Helwe Chaithra Reddy Nerella Chen Cecilia Liu Chiamaka Nwokolo Christopher Homan Cl\'ement Sampebgo Cristina Espa\~na-Bonet Cynthia Amol Daeyoep Lee Dan Saattrup Smart Dana Arad Daniil Dzenhaliou Dasol Choi David Liu David Semedo David Anugraha Deborah Popoola Deividas Mataciunas Delphine Nyaboke Dennis Owusu Dhyuthy Krishna Kumar Diogo Tavares Diogo Gl\'oria-Silva Divyanshu Goyal DongGeon Lee E. Kelly Buchanan Ebele Nwamaka Anajemba Egonu Ngozi Grace Elena Mickel Elias Herranen Eliza Acharya Eman Nisar Emile Anand Emmanuel Habumuremyi Emuobonuvie Maria Ajiboye Eryawan Presma Yulianrifat Esther Adenuga Ewa Rudnicka Faith Itiola Faran Taimoor Butt Fareeha Fayyaz Sheikh Fathima Thekkekara Fatima Haouari Faustin Nsengiyumva Fenal Ashokbhai Ilasariya Filbert Aurelian Tjiaranata Firas Laakom Francesca Grasso Francesco Periti Francesco Orabona Gbenga Kayode Solomon Genta Indra Winata Gia Nghia Ngo Gloria Udhedhe-oze Gon\c{c}alo Vinagre Gopi Naga Sai Ram Challagolla Gorka Urbizu-Garmendia Gouthami Vadithya Guijin Son Gulnaz Abdykadyrova Gyan Swaroop Mohapatra Hafeez Ullah Hafsteinn Einarsson Hai Hu Hamidreza Saffari Hamza Zaidi Haopeng Zhang Harethah Abu Shairah Harry Vuong Hele-Andra Kuulmets Hitesh Laxmichand Patel Houda Bouamor Hwanjo Yu Iben Nyholm Debess \.Ibrahim Ethem Deveci Ikhlasul Akmal Hanif Ikhyun Cho In\^es Vieira In\^es Calvo Isaac Manzi Ismael Illa Salifou Ismail Daud Ismail Yusuf Itay Itzhak Ivan Zhelyazkov Ivan Belashkin Ivan Spada Jacob Brinton Jafar Isbarov Jaka \v{C}ibej Jan Koco\'n Jan Cuhel Jauza Krito Jebish Purbey Jennifer Za Jennifer Mickel Jenny Kunz Jessica Ratovondranto Jeyarajalingam Varsha Jihae Jeong Jimena Tena D\'avalos Jinu Lee Jo\~ao Magalh\~aes John Seon Keun Yi Jongin Kim Joseph Chataignon Joseph Marvin Imperial Jubeerathan Thevakumar Judith Land Julia Alekseenko Junchen Jiang Jungwhan Kim Kairit Sirts Kamesh R Kamesh V Kanda Tshinu K\"atriin Kukk Kaustubh Ponkshe Kavsar Huseynova Ke He Kenneth Enevoldsen Kent Joshua Alvarez Kerem Zaman Khalil Mrini Kian Kyars Komal Gour Krishnakumar Lainitha Krister Kruusmaa Kunal Mukherjee Kusum Chouhan Laura Castro Laura M. Porrino-Moscoso Lenny Sivi Za Nzambi Leshem Choshen Levent Sencan Lilja {\O}vrelid Lisa Alazraki Loretta Oma Jones Lovina Ehimen-Ugbede Luheerathan Thevakumar Luxshan Thavarasa Mahnoor Malik Mamadou K. Keita Mansi Jangid Marco De Santis Marcos Garcia Marek \v{S}uppa Mariam D'Ciofalo Marii Ojastu Marium Attaullah Maryam Sikander Mausami Narayan Maximos Skandalis Mehak Mehak Mehmet \.Ilteri\c{s} Bozkurt Melaku Bayu Menan Velayuthan Mhasilenuo Vizo Michael Leventhal Micha{\l} Marci\'nczuk Mina Almasi Mirna Poto\v{c}njak Mithil Bangera Mohammadamin Shafiei Mohiba Ansari Mridul Sharma Mrityunjaya Indoria Mughees Ur Rehman Muhammad Ravi Shulthan Habibi Murat Koli\'c Murat Bark{\i}n K{\i}nay Nada Galant Naina Singh Rathore Naphat Permpredanun Narada Maugin Nathalie Norman Nicholas Kluge Corr\^ea Nikola Ljube\v{s}i\'c Nirmal Thomas Nisansa de Silva Nisheeth Joshi Nitish Ponkshe Nizar Habash Nneoma Udeze Noel Thomas No\'emi Ligeti-Nagy Nouhoum Coulibaly Odunayo Ogundepo Odunayo Kareemat Buliaminu Oghojafor Godswill Fejiro Okechukwu God'spraise Olanrewaju Samuel Olaoye Deborah Oluwaseun Olasoji Akindejoye Olga Snissarenko Onyinye Anulika Chiemezie Orkun K{\i}nay Osman Tursun Oyelade Oluwafemi Joshua Oyesanmi Fiyinfoluwa Pablo Rodr\'iguez Pablo Gamallo Palak Arora Pedro Valente Peter Rupnik Philip Oghenesuowho Ekiugbo Prakhar Agarwal Pramit Sahoo Prokopis Prokopidis Pua Niau-Puhipau Quadri Yahya Rachele Mignone Raghav Singhal Rahul Raja Ram Mohan Rao Kadiyala Raphael Merx Rasmus Larsen Ratnavel Rajalakshmi Rishav Ghosh Romina Oji Ron Kekeha Solis Rui Guerra Rushikesh Zawar Sa'ad Nasir Bashir Saeed Alzaabi Sahil Sandeep Sai Pavan Batchu Sai Sandeep Kantareddy Saleha Muzammil Salsabila Zahirah Pranida Sam Buchanan Samuel Rutunda Sander Land Sarah Sulollari Sardar Ali Saroj Sapkota Sarveswaran Kengatharaiyer Saulius Tautvaisas Sayambhu Sen Sayantani Banerjee Sebastien Diarra Segun Afolayan Senthilnathan M Sewoong Lee Shaan Shah Shankar Venkitachalam Sharifa Djurabaeva Sharon Ibejih Shivanya Shomir Dutta Siddhant Gupta Silvia Paniagua Su\'arez Sina Ahmadi Sivasuthan Sukumar Siyuan Song Snegha A Sokratis Sofianopoulos Sona Elza Simon Sonja Ben\v{c}ina Sophie Gvasalia Sphurti More Spyros Dragazis Stefan Milosavljevi\'c Stephan P. Kaufhold Suba S Sultan Alrashed Surangika Ranathunga Taiga Someya Taja Kuzman Punger\v{s}ek Tal Haklay Tasi'u Jibril Tatsuya Aoyama Tea Abashidze Terenz Jomar Dela Cruz Terra Blevins Themistoklis Nikas Theresa Idoko Thu Mai Do Tilek Chubakov Tina Munda Tobiloba Owoeye Tommaso Gargiani Uma Rathore Uni Johannesen Uwuma Ugwu Vallerie Alexandra Putra Vanya Bannihatti Kumar Varvara Arzt Vasily Konovalov Vasudevan Nedumpozhimana Viktoria Ondrejova Viktoryia Horbik Vishnu Vardhan Reddy Kummitha Vuk Dini\'c Walelign Sewunetie Winston Wu Xiaojing Zhao Yacouba Diarra Yaniv Nikankin Yash Mathur Yash Bagla Yeshil Bangera Yixi Chen Yiyuan Li Yolanda Xavier Yonatan Belinkov Zaid Alyafeai Zhargal Batozargalova Zhengyang Shan Zhi Rui Tam Zilu Tang Zuzana Nadova Baber Abbasi Stella Biderman David Stap Duygu Ataman Fabian Schmidt Hila Gonen Jiayi Wang David Ifeoluwa Adelani

This is my paper

classification 💻 cs.CL

keywords globallanguagespiqalanguageculturesreasoningcommonsensellms

0 comments

read the original abstract

To date, there exist almost no culturally-specific evaluation benchmarks for large language models (LLMs) that cover a large number of languages and cultures. In this paper, we present Global PIQA, a participatory commonsense reasoning benchmark for over 100 languages, constructed by hand by over 350 researchers from over 65 countries around the world. The 141 language varieties in Global PIQA cover five continents, 19 language families, and 24 writing systems. In the non-parallel split of Global PIQA, over 50% of examples reference local foods, customs, traditions, or other culturally-specific elements. In the parallel split, we translate more "culturally agnostic" commonsense reasoning questions into 131 language varieties, for direct cross-lingual comparisons. In both splits, all examples have been verified by native speakers of the languages. We find that state-of-the-art LLMs perform well on Global PIQA in aggregate, but they exhibit weaker performance in lower-resource languages (e.g. up to a 68% accuracy gap between languages in the parallel split). Global PIQA highlights that in many languages and cultures, everyday knowledge remains an area for improvement in LLMs, alongside more widely-discussed capabilities such as complex reasoning and expert knowledge. Beyond its uses for LLM evaluation, Global PIQA provides a glimpse into the wide diversity of cultures in which human language is embedded.

This paper has not been read by Pith yet.

discussion (0)

Forward citations

Cited by 4 Pith papers

Reviewed papers in the Pith corpus that reference this work. Sorted by Pith novelty score.

Multilingual Knowledge Transfer under Data Constraints via Lexical Interventions
cs.CL 2026-05 unverdicted novelty 6.0

LINK improves cross-lingual knowledge transfer via lexical substitutions in English pretraining data, yielding notable downstream gains and up to 2x training speedup across eight languages and five model sizes.
Maistros: A Greek Large Language Model Adapted Through Knowledge Distillation From Large Reasoning Models
cs.CL 2026-05 unverdicted novelty 6.0

Maistros 8B is a new state-of-the-art open-weights Greek LLM built via knowledge distillation from large reasoning models on the CulturaQA dataset.
What properties of reasoning supervision are associated with improved downstream model quality?
cs.AI 2026-05 unverdicted novelty 5.0

Intrinsic data metrics predict reasoning dataset utility for model fine-tuning, with different predictors working best for smaller versus larger models.
A Survey of Text and Speech Resources for Hausa and Fongbe: Availability, Quality, and Gaps for NLP Development
cs.CL 2026-04 unverdicted novelty 4.0

A survey catalogs text and speech resources for Hausa and Fongbe, documenting sizes, domains, licensing, and gaps including limited Fongbe text diversity and missing Hausa speech corpora.