{"record_type":"pith_number_record","schema_url":"https://pith.science/schemas/pith-number/v1.json","pith_number":"pith:2023:PMENC4IH2NLSJ2HU4TJWJ2AY6D","short_pith_number":"pith:PMENC4IH","schema_version":"1.0","canonical_sha256":"7b08d17107d35724e8f4e4d364e818f0e5b61ba352481231be2099f410f241da","source":{"kind":"arxiv","id":"2308.13561","version":3},"attestation_state":"computed","paper":{"title":"Project Aria: A New Tool for Egocentric Multi-Modal AI Research","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","headline":"Meta researchers built the Aria wearable to record egocentric multi-modal data for AR and AI research.","cross_cats":["cs.CV"],"primary_cat":"cs.HC","authors_text":"Albert Sun, Alexander Gamino, Andrew Turner, Arjang Talattof, Arnie Yuan, Bilal Souti, Brighid Meredith, Carl Ren, Cheng Peng, Chris Sweeney, Cole Wilson, Dan Barnes, Daniel DeTone, David Caruso, Derek Valleroy, Dinesh Ginjupalli, Duncan Frost, Edward Miller, Elias Mueggler, Evgeniy Oleinik, Fan Zhang, Guruprasad Somasundaram, Gustavo Solaira, Harry Lanaras, Henry Howard-Jenkins, Huixuan Tang, Hyo Jin Kim, Jaime Rivera, Jakob Engel, Ji Luo, Jing Dong, Julian Straub, Kevin Bailey, Kevin Eckenhoff, Kiran Somasundaram, Lingni Ma, Luis Pesqueira, Mark Schwesinger, Maurizio Monge, Michael Goesele, Mingfei Yan, Nan Yang, Nick Charron, Nikhil Raina, Omkar Parkhi, Peter Borschowa, Pierre Moulon, Prince Gupta, Raul Mur-Artal, Renzo De Nardi, Richard Newcombe, Robbie Pennington, Sachin Kulkarni, Sagar Miglani, Santosh Gondi, Saransh Solanki, Sean Diener, Shangyi Cheng, Simon Green, Steve Saarinen, Suvam Patra, Tassos Mourikis, Thomas Whelan, Tripti Singh, Vasileios Balntas, Vijay Baiyya, Wilson Dreewes, Xiaqing Pan, Yang Lou, Yipu Zhao, Yusuf Mansour, Yuyang Zou, Zhaoyang Lv, Zijian Wang","submitted_at":"2023-08-24T20:42:21Z","abstract_excerpt":"Egocentric, multi-modal data as available on future augmented reality (AR) devices provides unique challenges and opportunities for machine perception. These future devices will need to be all-day wearable in a socially acceptable form-factor to support always available, context-aware and personalized AI applications. Our team at Meta Reality Labs Research built the Aria device, an egocentric, multi-modal data recording and streaming device with the goal to foster and accelerate research in this area. In this paper, we describe the Aria device hardware including its sensor configuration and th"},"verification_status":{"content_addressed":true,"pith_receipt":true,"author_attested":false,"weak_author_claims":0,"strong_author_claims":0,"externally_anchored":false,"storage_verified":false,"citation_signatures":0,"replication_records":0,"graph_snapshot":true,"references_resolved":true,"formal_links_present":true},"canonical_record":{"source":{"id":"2308.13561","kind":"arxiv","version":3},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.HC","submitted_at":"2023-08-24T20:42:21Z","cross_cats_sorted":["cs.CV"],"title_canon_sha256":"6cf2eca6410f662169cadd5bb433426751a2ae7c6cb9f72bc5cff2f9b6497c0a","abstract_canon_sha256":"221cc5ebc193ab3acbdbc3469647cec428873fc314331a6981b641148bbe9c86"},"schema_version":"1.0"},"receipt":{"kind":"pith_receipt","key_id":"pith-v1-2026-05","algorithm":"ed25519","signed_at":"2026-05-17T23:38:53.029021Z","signature_b64":"N/SwP24xH/iPHad9iiEWGM4A6O1xecO2XwRQOLIqs4Vox6tInIZI0oa35Hjxs7MgMlkFqLAAdNe5F6W2GWsuAw==","signed_message":"canonical_sha256_bytes","builder_version":"pith-number-builder-2026-05-17-v1","receipt_version":"0.3","canonical_sha256":"7b08d17107d35724e8f4e4d364e818f0e5b61ba352481231be2099f410f241da","last_reissued_at":"2026-05-17T23:38:53.028528Z","signature_status":"signed_v1","first_computed_at":"2026-05-17T23:38:53.028528Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"graph_snapshot":{"paper":{"title":"Project Aria: A New Tool for Egocentric Multi-Modal AI Research","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","headline":"Meta researchers built the Aria wearable to record egocentric multi-modal data for AR and AI research.","cross_cats":["cs.CV"],"primary_cat":"cs.HC","authors_text":"Albert Sun, Alexander Gamino, Andrew Turner, Arjang Talattof, Arnie Yuan, Bilal Souti, Brighid Meredith, Carl Ren, Cheng Peng, Chris Sweeney, Cole Wilson, Dan Barnes, Daniel DeTone, David Caruso, Derek Valleroy, Dinesh Ginjupalli, Duncan Frost, Edward Miller, Elias Mueggler, Evgeniy Oleinik, Fan Zhang, Guruprasad Somasundaram, Gustavo Solaira, Harry Lanaras, Henry Howard-Jenkins, Huixuan Tang, Hyo Jin Kim, Jaime Rivera, Jakob Engel, Ji Luo, Jing Dong, Julian Straub, Kevin Bailey, Kevin Eckenhoff, Kiran Somasundaram, Lingni Ma, Luis Pesqueira, Mark Schwesinger, Maurizio Monge, Michael Goesele, Mingfei Yan, Nan Yang, Nick Charron, Nikhil Raina, Omkar Parkhi, Peter Borschowa, Pierre Moulon, Prince Gupta, Raul Mur-Artal, Renzo De Nardi, Richard Newcombe, Robbie Pennington, Sachin Kulkarni, Sagar Miglani, Santosh Gondi, Saransh Solanki, Sean Diener, Shangyi Cheng, Simon Green, Steve Saarinen, Suvam Patra, Tassos Mourikis, Thomas Whelan, Tripti Singh, Vasileios Balntas, Vijay Baiyya, Wilson Dreewes, Xiaqing Pan, Yang Lou, Yipu Zhao, Yusuf Mansour, Yuyang Zou, Zhaoyang Lv, Zijian Wang","submitted_at":"2023-08-24T20:42:21Z","abstract_excerpt":"Egocentric, multi-modal data as available on future augmented reality (AR) devices provides unique challenges and opportunities for machine perception. These future devices will need to be all-day wearable in a socially acceptable form-factor to support always available, context-aware and personalized AI applications. Our team at Meta Reality Labs Research built the Aria device, an egocentric, multi-modal data recording and streaming device with the goal to foster and accelerate research in this area. In this paper, we describe the Aria device hardware including its sensor configuration and th"},"claims":{"count":4,"items":[{"kind":"strongest_claim","text":"Our team at Meta Reality Labs Research built the Aria device, an egocentric, multi-modal data recording and streaming device with the goal to foster and accelerate research in this area.","source":"verdict.strongest_claim","status":"machine_extracted","claim_id":"C1","attestation":"unclaimed"},{"kind":"weakest_assumption","text":"That the described hardware configuration, sensor suite, and software tools will prove sufficient and accessible enough for the broader research community to meaningfully advance egocentric multi-modal AI.","source":"verdict.weakest_assumption","status":"machine_extracted","claim_id":"C2","attestation":"unclaimed"},{"kind":"one_line_summary","text":"Project Aria presents a new wearable egocentric multi-modal recording device and software tools to accelerate AI research for augmented reality applications.","source":"verdict.one_line_summary","status":"machine_extracted","claim_id":"C3","attestation":"unclaimed"},{"kind":"headline","text":"Meta researchers built the Aria wearable to record egocentric multi-modal data for AR and AI research.","source":"verdict.pith_extraction.headline","status":"machine_extracted","claim_id":"C4","attestation":"unclaimed"}],"snapshot_sha256":"08ebc38dd505c39dd0124ea12b808f3ea98ef1b5c7de56d7e22d98b9bddcadd2"},"source":{"id":"2308.13561","kind":"arxiv","version":3},"verdict":{"id":"ce4623b8-c16f-4e95-93aa-0bb1b4c2968b","model_set":{"reader":"grok-4.3"},"created_at":"2026-05-15T08:21:09.430783Z","strongest_claim":"Our team at Meta Reality Labs Research built the Aria device, an egocentric, multi-modal data recording and streaming device with the goal to foster and accelerate research in this area.","one_line_summary":"Project Aria presents a new wearable egocentric multi-modal recording device and software tools to accelerate AI research for augmented reality applications.","pipeline_version":"pith-pipeline@v0.9.0","weakest_assumption":"That the described hardware configuration, sensor suite, and software tools will prove sufficient and accessible enough for the broader research community to meaningfully advance egocentric multi-modal AI.","pith_extraction_headline":"Meta researchers built the Aria wearable to record egocentric multi-modal data for AR and AI research."},"references":{"count":22,"sample":[{"doi":"","year":null,"title":"https : / / facebookresearch","work_id":"6e06d062-cd4f-450f-b067-31521ec1e903","ref_index":1,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":null,"title":"https://facebookresearch","work_id":"79ad577b-55e2-472b-9059-608fb4bf1901","ref_index":2,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":null,"title":"https://github.com/ facebookresearch/projectaria tools","work_id":"40db6826-8994-45b0-b1cf-ada42e34e669","ref_index":3,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":null,"title":"https://www.projectaria.com/","work_id":"9eba3fb5-faff-466b-a554-ec670b284dd0","ref_index":4,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":null,"title":"https : / / about.meta.com/realitylabs/projectaria/community- guidelines/","work_id":"69524ada-d9b0-4dd6-a781-59147afa5a3b","ref_index":5,"cited_arxiv_id":"","is_internal_anchor":false}],"resolved_work":22,"snapshot_sha256":"2c77767774293c1b78180189a07135ae3a98ccf0aaeb64607134be29c260ccf8","internal_anchors":4},"formal_canon":{"evidence_count":2,"snapshot_sha256":"5e902ba8593516e9ea9929d607fee5c886268501b4c47c3e48a0d101040014fd"},"author_claims":{"count":0,"strong_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"builder_version":"pith-number-builder-2026-05-17-v1"},"aliases":[{"alias_kind":"arxiv","alias_value":"2308.13561","created_at":"2026-05-17T23:38:53.028614+00:00"},{"alias_kind":"arxiv_version","alias_value":"2308.13561v3","created_at":"2026-05-17T23:38:53.028614+00:00"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.2308.13561","created_at":"2026-05-17T23:38:53.028614+00:00"},{"alias_kind":"pith_short_12","alias_value":"PMENC4IH2NLS","created_at":"2026-05-18T12:33:37.589309+00:00"},{"alias_kind":"pith_short_16","alias_value":"PMENC4IH2NLSJ2HU","created_at":"2026-05-18T12:33:37.589309+00:00"},{"alias_kind":"pith_short_8","alias_value":"PMENC4IH","created_at":"2026-05-18T12:33:37.589309+00:00"}],"events":[],"event_summary":{},"paper_claims":[],"inbound_citations":{"count":29,"internal_anchor_count":29,"sample":[{"citing_arxiv_id":"2503.16492","citing_title":"FAM-HRI: Foundation-Model Assisted Multi-Modal Human-Robot Interaction Combining Gaze and Speech","ref_index":13,"is_internal_anchor":true},{"citing_arxiv_id":"2605.22359","citing_title":"GazePrior: Zero-Shot AR/VR Eye Tracking via Learned 3D Gaze Reconstruction","ref_index":5,"is_internal_anchor":true},{"citing_arxiv_id":"2605.17262","citing_title":"EgoIntrospect: An Egocentric Dataset and Benchmark for User-Centric Internal State Reasoning","ref_index":2,"is_internal_anchor":true},{"citing_arxiv_id":"2605.19976","citing_title":"RECIPE: Procedural Planning via Grounding in Instructional Video","ref_index":37,"is_internal_anchor":true},{"citing_arxiv_id":"2605.16797","citing_title":"EgoKit: Towards Unified Low-Cost Egocentric Data Collection with Heterogeneous Devices","ref_index":2,"is_internal_anchor":true},{"citing_arxiv_id":"2505.24848","citing_title":"Reading Recognition in the Wild","ref_index":12,"is_internal_anchor":true},{"citing_arxiv_id":"2508.00088","citing_title":"The Monado SLAM Dataset for Egocentric Visual-Inertial Tracking","ref_index":5,"is_internal_anchor":true},{"citing_arxiv_id":"2602.00793","citing_title":"SpeechLess: Micro-utterance with Personalized Spatial Memory-aware Assistant in Everyday Augmented Reality","ref_index":22,"is_internal_anchor":true},{"citing_arxiv_id":"2604.23927","citing_title":"Towards Localizing Conversation Partners using Head Motion","ref_index":19,"is_internal_anchor":true},{"citing_arxiv_id":"2604.03486","citing_title":"VisionClaw: Always-On AI Agents through Smart Glasses","ref_index":13,"is_internal_anchor":true},{"citing_arxiv_id":"2604.03878","citing_title":"Learning 3D Reconstruction with Priors in Test Time","ref_index":10,"is_internal_anchor":true},{"citing_arxiv_id":"2605.05680","citing_title":"MotionGRPO: Overcoming Low Intra-Group Diversity in GRPO-Based Egocentric Motion Recovery","ref_index":3,"is_internal_anchor":true},{"citing_arxiv_id":"2507.13347","citing_title":"$\\pi^3$: Permutation-Equivariant Visual Geometry Learning","ref_index":2,"is_internal_anchor":true},{"citing_arxiv_id":"2605.10936","citing_title":"Personal Visual Context Learning in Large Multimodal Models","ref_index":20,"is_internal_anchor":true},{"citing_arxiv_id":"2604.26182","citing_title":"Lifting Embodied World Models for Planning and Control","ref_index":9,"is_internal_anchor":true},{"citing_arxiv_id":"2604.23927","citing_title":"Towards Localizing Conversation Partners using Head Motion","ref_index":19,"is_internal_anchor":true},{"citing_arxiv_id":"2605.06628","citing_title":"LiVeAction: a Lightweight, Versatile, and Asymmetric Neural Codec Design for Real-time Operation","ref_index":1,"is_internal_anchor":true},{"citing_arxiv_id":"2605.05790","citing_title":"GazeMind: A Gaze-Guided LLM Agent for Personalized Cognitive Load Assessment","ref_index":16,"is_internal_anchor":true},{"citing_arxiv_id":"2604.22615","citing_title":"GazeVLA: Learning Human Intention for Robotic Manipulation","ref_index":22,"is_internal_anchor":true},{"citing_arxiv_id":"2605.05680","citing_title":"MotionGRPO: Overcoming Low Intra-Group Diversity in GRPO-Based Egocentric Motion Recovery","ref_index":3,"is_internal_anchor":true},{"citing_arxiv_id":"2605.05390","citing_title":"LAMP: Localization Aware Multi-camera People Tracking in Metric 3D World","ref_index":15,"is_internal_anchor":true},{"citing_arxiv_id":"2605.04227","citing_title":"Pro$^2$Assist: Continuous Step-Aware Proactive Assistance with Multimodal Egocentric Perception for Long-Horizon Procedural Tasks","ref_index":33,"is_internal_anchor":true},{"citing_arxiv_id":"2604.07607","citing_title":"EgoVerse: An Egocentric Human Dataset for Robot Learning from Around the World","ref_index":15,"is_internal_anchor":true},{"citing_arxiv_id":"2604.09535","citing_title":"EgoTL: Egocentric Think-Aloud Chains for Long-Horizon Tasks","ref_index":12,"is_internal_anchor":true},{"citing_arxiv_id":"2604.09886","citing_title":"Not Your Stereo-Typical Estimator: Combining Vision and Language for Volume Perception","ref_index":7,"is_internal_anchor":true}]},"formal_canon":{"evidence_count":2,"sample":[],"anchors":[]},"links":{"html":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D","json":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D.json","graph_json":"https://pith.science/api/pith-number/PMENC4IH2NLSJ2HU4TJWJ2AY6D/graph.json","events_json":"https://pith.science/api/pith-number/PMENC4IH2NLSJ2HU4TJWJ2AY6D/events.json","paper":"https://pith.science/paper/PMENC4IH"},"agent_actions":{"view_html":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D","download_json":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D.json","view_paper":"https://pith.science/paper/PMENC4IH","resolve_alias":"https://pith.science/api/pith-number/resolve?arxiv=2308.13561&json=true","fetch_graph":"https://pith.science/api/pith-number/PMENC4IH2NLSJ2HU4TJWJ2AY6D/graph.json","fetch_events":"https://pith.science/api/pith-number/PMENC4IH2NLSJ2HU4TJWJ2AY6D/events.json","actions":{"anchor_timestamp":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D/action/timestamp_anchor","attest_storage":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D/action/storage_attestation","attest_author":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D/action/author_attestation","sign_citation":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D/action/citation_signature","submit_replication":"https://pith.science/pith/PMENC4IH2NLSJ2HU4TJWJ2AY6D/action/replication_record"}},"created_at":"2026-05-17T23:38:53.028614+00:00","updated_at":"2026-05-17T23:38:53.028614+00:00"}