{"record_type":"pith_number_record","schema_url":"https://pith.science/schemas/pith-number/v1.json","pith_number":"pith:2018:EFBOAY3NFQ2XQGIPSTPK7P4HYN","short_pith_number":"pith:EFBOAY3N","schema_version":"1.0","canonical_sha256":"2142e0636d2c3578190f94deafbf87c3557980a226eb7042789571153780bb09","source":{"kind":"arxiv","id":"1807.06757","version":1},"attestation_state":"computed","paper":{"title":"On Evaluation of Embodied Navigation Agents","license":"http://creativecommons.org/licenses/by/4.0/","headline":"Embodied navigation research requires standardized evaluation measures and scenarios to allow direct comparison of agents.","cross_cats":["cs.CV","cs.LG","cs.RO"],"primary_cat":"cs.AI","authors_text":"Alexey Dosovitskiy, Amir R. Zamir, Angel Chang, Devendra Singh Chaplot, Jana Kosecka, Jitendra Malik, Manolis Savva, Peter Anderson, Roozbeh Mottaghi, Saurabh Gupta, Vladlen Koltun","submitted_at":"2018-07-18T03:28:02Z","abstract_excerpt":"Skillful mobile operation in three-dimensional environments is a primary topic of study in Artificial Intelligence. The past two years have seen a surge of creative work on navigation. This creative output has produced a plethora of sometimes incompatible task definitions and evaluation protocols. To coordinate ongoing and future research in this area, we have convened a working group to study empirical methodology in navigation research. The present document summarizes the consensus recommendations of this working group. We discuss different problem statements and the role of generalization, "},"verification_status":{"content_addressed":true,"pith_receipt":true,"author_attested":false,"weak_author_claims":0,"strong_author_claims":0,"externally_anchored":false,"storage_verified":false,"citation_signatures":0,"replication_records":0,"graph_snapshot":true,"references_resolved":true,"formal_links_present":true},"canonical_record":{"source":{"id":"1807.06757","kind":"arxiv","version":1},"metadata":{"license":"http://creativecommons.org/licenses/by/4.0/","primary_cat":"cs.AI","submitted_at":"2018-07-18T03:28:02Z","cross_cats_sorted":["cs.CV","cs.LG","cs.RO"],"title_canon_sha256":"8171ddec4e5f633f14043a070bf899dd820e5d1ef376ba573fd4164cfb96233f","abstract_canon_sha256":"2aa7c043ae02c42098e307294479deb5b04d6e5097cee5d41556525bb9422b2b"},"schema_version":"1.0"},"receipt":{"kind":"pith_receipt","key_id":"pith-v1-2026-05","algorithm":"ed25519","signed_at":"2026-05-18T04:05:26.139070Z","signature_b64":"+Ju4Ews+Zi92hCUCl8Yrr7uAV0Sna3wE0KKN+UwdoHUmb/b9BlJ4QeQ4RvP23RCj5JpWAzksQv3HiAo+dLjTAg==","signed_message":"canonical_sha256_bytes","builder_version":"pith-number-builder-2026-05-17-v1","receipt_version":"0.3","canonical_sha256":"2142e0636d2c3578190f94deafbf87c3557980a226eb7042789571153780bb09","last_reissued_at":"2026-05-18T04:05:26.137734Z","signature_status":"signed_v1","first_computed_at":"2026-05-18T04:05:26.137734Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"graph_snapshot":{"paper":{"title":"On Evaluation of Embodied Navigation Agents","license":"http://creativecommons.org/licenses/by/4.0/","headline":"Embodied navigation research requires standardized evaluation measures and scenarios to allow direct comparison of agents.","cross_cats":["cs.CV","cs.LG","cs.RO"],"primary_cat":"cs.AI","authors_text":"Alexey Dosovitskiy, Amir R. Zamir, Angel Chang, Devendra Singh Chaplot, Jana Kosecka, Jitendra Malik, Manolis Savva, Peter Anderson, Roozbeh Mottaghi, Saurabh Gupta, Vladlen Koltun","submitted_at":"2018-07-18T03:28:02Z","abstract_excerpt":"Skillful mobile operation in three-dimensional environments is a primary topic of study in Artificial Intelligence. The past two years have seen a surge of creative work on navigation. This creative output has produced a plethora of sometimes incompatible task definitions and evaluation protocols. To coordinate ongoing and future research in this area, we have convened a working group to study empirical methodology in navigation research. The present document summarizes the consensus recommendations of this working group. We discuss different problem statements and the role of generalization, "},"claims":{"count":4,"items":[{"kind":"strongest_claim","text":"To coordinate ongoing and future research in this area, we have convened a working group to study empirical methodology in navigation research. The present document summarizes the consensus recommendations of this working group. We discuss different problem statements and the role of generalization, present evaluation measures, and provide standard scenarios that can be used for benchmarking.","source":"verdict.strongest_claim","status":"machine_extracted","claim_id":"C1","attestation":"unclaimed"},{"kind":"weakest_assumption","text":"That the research community will adopt the proposed evaluation measures and standard scenarios rather than continuing with incompatible custom protocols.","source":"verdict.weakest_assumption","status":"machine_extracted","claim_id":"C2","attestation":"unclaimed"},{"kind":"one_line_summary","text":"Consensus recommendations for standardized evaluation measures, problem statements, and benchmarking scenarios in embodied navigation research.","source":"verdict.one_line_summary","status":"machine_extracted","claim_id":"C3","attestation":"unclaimed"},{"kind":"headline","text":"Embodied navigation research requires standardized evaluation measures and scenarios to allow direct comparison of agents.","source":"verdict.pith_extraction.headline","status":"machine_extracted","claim_id":"C4","attestation":"unclaimed"}],"snapshot_sha256":"c4122f11bae2377388bbe5eb90a6876e4710a278226db74966ca74ada34abb94"},"source":{"id":"1807.06757","kind":"arxiv","version":1},"verdict":{"id":"7637ed82-63be-4b48-883b-939a3500fb54","model_set":{"reader":"grok-4.3"},"created_at":"2026-05-13T22:39:18.240039Z","strongest_claim":"To coordinate ongoing and future research in this area, we have convened a working group to study empirical methodology in navigation research. The present document summarizes the consensus recommendations of this working group. We discuss different problem statements and the role of generalization, present evaluation measures, and provide standard scenarios that can be used for benchmarking.","one_line_summary":"Consensus recommendations for standardized evaluation measures, problem statements, and benchmarking scenarios in embodied navigation research.","pipeline_version":"pith-pipeline@v0.9.0","weakest_assumption":"That the research community will adopt the proposed evaluation measures and standard scenarios rather than continuing with incompatible custom protocols.","pith_extraction_headline":"Embodied navigation research requires standardized evaluation measures and scenarios to allow direct comparison of agents."},"references":{"count":32,"sample":[{"doi":"","year":2018,"title":"P. Anderson, Q. Wu, D. Teney, J. Bruce, M. Johnson, N. S ¨underhauf, I. Reid, S. Gould, and A. van den Hen- gel. Vision-and-language navigation: Interpreting visually- grounded navigation instructions","work_id":"0218f0cb-7cb9-4892-b121-4c95cbb87529","ref_index":1,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":2016,"title":"DeepMind Lab","work_id":"8a8d827f-5377-4733-bfe8-bc66c011d458","ref_index":2,"cited_arxiv_id":"1612.03801","is_internal_anchor":false},{"doi":"","year":2017,"title":"S. Brahmbhatt and J. Hays. DeepNav: Learning to navigate large cities. In CVPR, 2017","work_id":"944ac7b5-c225-47ea-b579-7895e72683d6","ref_index":3,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":2017,"title":"S. Brodeur, E. Perez, A. Anand, F. Golemo, L. Celotti, F. Strub, J. Rouat, H. Larochelle, and A. C. Courville. HoME: A household multimodal environment. arXiv:1711.11017, 2017","work_id":"c72fdedd-f8c1-43cb-9ad9-4fdc4d2a01cf","ref_index":4,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":1993,"title":"R. A. Brooks and M. J. Mataric. Real robots, real learning problems. In Robot Learning. 1993","work_id":"57766d11-a763-4d9f-9e11-5afbe33b5df7","ref_index":5,"cited_arxiv_id":"","is_internal_anchor":false}],"resolved_work":32,"snapshot_sha256":"1c7dfb48d21ab7ff9f2b3fca3c4cc1390a2e8a39566dd09c9f7e3057aa249b24","internal_anchors":1},"formal_canon":{"evidence_count":2,"snapshot_sha256":"1b22cdc038cf28480ff88cb314ed6ad2c813b90af39eb2b8f1f55d8ccccc127b"},"author_claims":{"count":0,"strong_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"builder_version":"pith-number-builder-2026-05-17-v1"},"aliases":[{"alias_kind":"arxiv","alias_value":"1807.06757","created_at":"2026-05-18T04:05:26.137821+00:00"},{"alias_kind":"arxiv_version","alias_value":"1807.06757v1","created_at":"2026-05-18T04:05:26.137821+00:00"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.1807.06757","created_at":"2026-05-18T04:05:26.137821+00:00"},{"alias_kind":"pith_short_12","alias_value":"EFBOAY3NFQ2X","created_at":"2026-05-18T12:32:22.470017+00:00"},{"alias_kind":"pith_short_16","alias_value":"EFBOAY3NFQ2XQGIP","created_at":"2026-05-18T12:32:22.470017+00:00"},{"alias_kind":"pith_short_8","alias_value":"EFBOAY3N","created_at":"2026-05-18T12:32:22.470017+00:00"}],"events":[],"event_summary":{},"paper_claims":[],"inbound_citations":{"count":40,"internal_anchor_count":40,"sample":[{"citing_arxiv_id":"2502.13498","citing_title":"Collision-Aware Object-Goal Visual Navigation via Two-Stage Deep Reinforcement Learning","ref_index":26,"is_internal_anchor":true},{"citing_arxiv_id":"2605.22816","citing_title":"AwareVLN: Reasoning with Self-awareness for Vision-Language Navigation","ref_index":4,"is_internal_anchor":true},{"citing_arxiv_id":"2605.19206","citing_title":"CLUE: Adaptively Prioritized Contextual Cues by Leveraging a Unified Semantic Map for Effective Zero-Shot Object-Goal Navigation","ref_index":24,"is_internal_anchor":true},{"citing_arxiv_id":"2605.16932","citing_title":"MORN: Metacognitive Object-Goal Regulation for Resource-Rational Long-Horizon Navigation","ref_index":29,"is_internal_anchor":true},{"citing_arxiv_id":"2605.16979","citing_title":"NORM-Nav: Zero-Shot Mobile Robot Navigation with Natural Language Behavioral Constraints","ref_index":31,"is_internal_anchor":true},{"citing_arxiv_id":"2605.09869","citing_title":"ConsistNav: Closing the Action Consistency Gap in Zero-Shot Object Navigation with Semantic Executive Control","ref_index":48,"is_internal_anchor":true},{"citing_arxiv_id":"2507.00435","citing_title":"RoboEval: Where Robotic Manipulation Meets Structured and Scalable Evaluation","ref_index":18,"is_internal_anchor":true},{"citing_arxiv_id":"2509.16445","citing_title":"FiLM-Nav: Efficient and Generalizable Navigation via VLM Fine-tuning","ref_index":19,"is_internal_anchor":true},{"citing_arxiv_id":"2402.15852","citing_title":"NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation","ref_index":6,"is_internal_anchor":true},{"citing_arxiv_id":"2505.03233","citing_title":"GraspVLA: a Grasping Foundation Model Pre-trained on Billion-scale Synthetic Action Data","ref_index":78,"is_internal_anchor":true},{"citing_arxiv_id":"2512.17435","citing_title":"ImagineNav++: Prompting Vision-Language Models as Embodied Navigator through Scene Imagination","ref_index":96,"is_internal_anchor":true},{"citing_arxiv_id":"2412.06224","citing_title":"Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks","ref_index":3,"is_internal_anchor":true},{"citing_arxiv_id":"2512.21714","citing_title":"AstraNav-World: World Model for Foresight Control and Consistency","ref_index":3,"is_internal_anchor":true},{"citing_arxiv_id":"2602.05467","citing_title":"MerNav: A Highly Generalizable Memory-Execute-Review Framework for Zero-Shot Object Goal Navigation","ref_index":3,"is_internal_anchor":true},{"citing_arxiv_id":"2603.20530","citing_title":"Memory Over Maps: 3D Object Localization Without Reconstruction","ref_index":57,"is_internal_anchor":true},{"citing_arxiv_id":"2605.09423","citing_title":"SimWorld Studio: Automatic Environment Generation with Evolving Coding Agent for Embodied Agent Learning","ref_index":2,"is_internal_anchor":true},{"citing_arxiv_id":"2109.08238","citing_title":"Habitat-Matterport 3D Dataset (HM3D): 1000 Large-scale 3D Environments for Embodied AI","ref_index":7,"is_internal_anchor":true},{"citing_arxiv_id":"2604.02389","citing_title":"Audio Spatially-Guided Fusion for Audio-Visual Navigation","ref_index":29,"is_internal_anchor":true},{"citing_arxiv_id":"1906.05797","citing_title":"The Replica Dataset: A Digital Replica of Indoor Spaces","ref_index":1,"is_internal_anchor":true},{"citing_arxiv_id":"2604.26504","citing_title":"HiPAN: Hierarchical Posture-Adaptive Navigation for Quadruped Robots in Unstructured 3D Environments","ref_index":43,"is_internal_anchor":true},{"citing_arxiv_id":"2604.26509","citing_title":"3D Generation for Embodied AI and Robotic Simulation: A Survey","ref_index":228,"is_internal_anchor":true},{"citing_arxiv_id":"2605.09423","citing_title":"SimWorld Studio: Automatic Environment Generation with Evolving Coding Agent for Embodied Agent Learning","ref_index":2,"is_internal_anchor":true},{"citing_arxiv_id":"2605.09441","citing_title":"Beyond Isolation: A Unified Benchmark for General-Purpose Navigation","ref_index":1,"is_internal_anchor":true},{"citing_arxiv_id":"2605.09869","citing_title":"ConsistNav: Closing the Action Consistency Gap in Zero-Shot Object Navigation with Semantic Executive Control","ref_index":48,"is_internal_anchor":true},{"citing_arxiv_id":"2604.26509","citing_title":"3D Generation for Embodied AI and Robotic Simulation: A Survey","ref_index":228,"is_internal_anchor":true}]},"formal_canon":{"evidence_count":2,"sample":[],"anchors":[]},"links":{"html":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN","json":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN.json","graph_json":"https://pith.science/api/pith-number/EFBOAY3NFQ2XQGIPSTPK7P4HYN/graph.json","events_json":"https://pith.science/api/pith-number/EFBOAY3NFQ2XQGIPSTPK7P4HYN/events.json","paper":"https://pith.science/paper/EFBOAY3N"},"agent_actions":{"view_html":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN","download_json":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN.json","view_paper":"https://pith.science/paper/EFBOAY3N","resolve_alias":"https://pith.science/api/pith-number/resolve?arxiv=1807.06757&json=true","fetch_graph":"https://pith.science/api/pith-number/EFBOAY3NFQ2XQGIPSTPK7P4HYN/graph.json","fetch_events":"https://pith.science/api/pith-number/EFBOAY3NFQ2XQGIPSTPK7P4HYN/events.json","actions":{"anchor_timestamp":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN/action/timestamp_anchor","attest_storage":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN/action/storage_attestation","attest_author":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN/action/author_attestation","sign_citation":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN/action/citation_signature","submit_replication":"https://pith.science/pith/EFBOAY3NFQ2XQGIPSTPK7P4HYN/action/replication_record"}},"created_at":"2026-05-18T04:05:26.137821+00:00","updated_at":"2026-05-18T04:05:26.137821+00:00"}