{"record_type":"pith_number_record","schema_url":"https://pith.science/schemas/pith-number/v1.json","pith_number":"pith:2019:UU7EXWUW64DLAQWOEM3G6CFCHI","short_pith_number":"pith:UU7EXWUW","schema_version":"1.0","canonical_sha256":"a53e4bda96f706b042ce23366f08a23a06cb062305d787af8243a34b34f59574","source":{"kind":"arxiv","id":"1903.11027","version":5},"attestation_state":"computed","paper":{"title":"nuScenes: A multimodal dataset for autonomous driving","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","headline":"nuScenes supplies 1000 annotated scenes with a full suite of cameras, lidar and radar to train and evaluate 3D detection and tracking for autonomous driving.","cross_cats":["cs.CV","cs.RO","stat.ML"],"primary_cat":"cs.LG","authors_text":"Alex H. Lang, Anush Krishnan, Giancarlo Baldan, Holger Caesar, Oscar Beijbom, Qiang Xu, Sourabh Vora, Varun Bankiti, Venice Erin Liong, Yu Pan","submitted_at":"2019-03-26T17:19:56Z","abstract_excerpt":"Robust detection and tracking of objects is crucial for the deployment of autonomous vehicle technology. Image based benchmark datasets have driven development in computer vision tasks such as object detection, tracking and segmentation of agents in the environment. Most autonomous vehicles, however, carry a combination of cameras and range sensors such as lidar and radar. As machine learning based methods for detection and tracking become more prevalent, there is a need to train and evaluate such methods on datasets containing range sensor data along with images. In this work we present nuTon"},"verification_status":{"content_addressed":true,"pith_receipt":true,"author_attested":false,"weak_author_claims":0,"strong_author_claims":0,"externally_anchored":false,"storage_verified":false,"citation_signatures":0,"replication_records":0,"graph_snapshot":true,"references_resolved":true,"formal_links_present":true},"canonical_record":{"source":{"id":"1903.11027","kind":"arxiv","version":5},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2019-03-26T17:19:56Z","cross_cats_sorted":["cs.CV","cs.RO","stat.ML"],"title_canon_sha256":"ba3a786ba489b9250d19493e51d3b8ce69b1edfe59adbe651c8dbf6d332e8be8","abstract_canon_sha256":"711012bff0871dcbe8a460f262d8920228652facccaf6163ca36391a8336abfb"},"schema_version":"1.0"},"receipt":{"kind":"pith_receipt","key_id":"pith-v1-2026-05","algorithm":"ed25519","signed_at":"2026-05-17T23:38:13.991739Z","signature_b64":"d4MnIAlnR0rZz0n2NxJO7uTDpoDOa12RioIEpltnqydFmWwncH84z0gJcUn9pL/Q6YG+fmpHSOjhsUNKlfOzCA==","signed_message":"canonical_sha256_bytes","builder_version":"pith-number-builder-2026-05-17-v1","receipt_version":"0.3","canonical_sha256":"a53e4bda96f706b042ce23366f08a23a06cb062305d787af8243a34b34f59574","last_reissued_at":"2026-05-17T23:38:13.991051Z","signature_status":"signed_v1","first_computed_at":"2026-05-17T23:38:13.991051Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"graph_snapshot":{"paper":{"title":"nuScenes: A multimodal dataset for autonomous driving","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","headline":"nuScenes supplies 1000 annotated scenes with a full suite of cameras, lidar and radar to train and evaluate 3D detection and tracking for autonomous driving.","cross_cats":["cs.CV","cs.RO","stat.ML"],"primary_cat":"cs.LG","authors_text":"Alex H. Lang, Anush Krishnan, Giancarlo Baldan, Holger Caesar, Oscar Beijbom, Qiang Xu, Sourabh Vora, Varun Bankiti, Venice Erin Liong, Yu Pan","submitted_at":"2019-03-26T17:19:56Z","abstract_excerpt":"Robust detection and tracking of objects is crucial for the deployment of autonomous vehicle technology. Image based benchmark datasets have driven development in computer vision tasks such as object detection, tracking and segmentation of agents in the environment. Most autonomous vehicles, however, carry a combination of cameras and range sensors such as lidar and radar. As machine learning based methods for detection and tracking become more prevalent, there is a need to train and evaluate such methods on datasets containing range sensor data along with images. In this work we present nuTon"},"claims":{"count":4,"items":[{"kind":"strongest_claim","text":"nuScenes comprises 1000 scenes, each 20s long and fully annotated with 3D bounding boxes for 23 classes and 8 attributes. It has 7x as many annotations and 100x as many images as the pioneering KITTI dataset.","source":"verdict.strongest_claim","status":"machine_extracted","claim_id":"C1","attestation":"unclaimed"},{"kind":"weakest_assumption","text":"The assumption that the 3D annotations and sensor calibrations are sufficiently accurate and representative of real-world autonomous-driving conditions to serve as a reliable training and evaluation benchmark.","source":"verdict.weakest_assumption","status":"machine_extracted","claim_id":"C2","attestation":"unclaimed"},{"kind":"one_line_summary","text":"nuScenes provides the first public autonomous-driving dataset that includes synchronized 360-degree data from cameras, radars, and lidar together with 3D bounding-box annotations across 1000 scenes.","source":"verdict.one_line_summary","status":"machine_extracted","claim_id":"C3","attestation":"unclaimed"},{"kind":"headline","text":"nuScenes supplies 1000 annotated scenes with a full suite of cameras, lidar and radar to train and evaluate 3D detection and tracking for autonomous driving.","source":"verdict.pith_extraction.headline","status":"machine_extracted","claim_id":"C4","attestation":"unclaimed"}],"snapshot_sha256":"6051985758a4f38a14534ca6ca0af201db20a85ec9ecdf93532ebbaa89dd04af"},"source":{"id":"1903.11027","kind":"arxiv","version":5},"verdict":{"id":"9f62c755-ebe7-4144-be85-a7fdb09a5eb2","model_set":{"reader":"grok-4.3"},"created_at":"2026-05-17T13:05:23.646814Z","strongest_claim":"nuScenes comprises 1000 scenes, each 20s long and fully annotated with 3D bounding boxes for 23 classes and 8 attributes. It has 7x as many annotations and 100x as many images as the pioneering KITTI dataset.","one_line_summary":"nuScenes provides the first public autonomous-driving dataset that includes synchronized 360-degree data from cameras, radars, and lidar together with 3D bounding-box annotations across 1000 scenes.","pipeline_version":"pith-pipeline@v0.9.0","weakest_assumption":"The assumption that the 3D annotations and sensor calibrations are sufficiently accurate and representative of real-world autonomous-driving conditions to serve as a reliable training and evaluation benchmark.","pith_extraction_headline":"nuScenes supplies 1000 annotated scenes with a full suite of cameras, lidar and radar to train and evaluate 3D detection and tracking for autonomous driving."},"references":{"count":90,"sample":[{"doi":"","year":2007,"title":"Vehicle and guard rail detection using radar and vision data fusion","work_id":"3e711389-ef4b-400f-b361-2a40423fa717","ref_index":1,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":2015,"title":"Exploiting 3d semantic scene priors for online trafﬁc light interpreta- tion","work_id":"bcc1ed53-5d56-4dd5-89b4-c428892e2074","ref_index":2,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":2014,"title":"Three decades of driver assistance systems: Review and future per- spectives","work_id":"292880ac-34c8-434a-be5f-3bdf4ace3070","ref_index":3,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":2006,"title":"Multiple object tracking performance metrics and evaluation in a smart room environment","work_id":"84537ed3-88a3-44ae-9136-775ff1ebac38","ref_index":4,"cited_arxiv_id":"","is_internal_anchor":false},{"doi":"","year":2019,"title":"Monoloco: Monocular 3d pedestrian localization and uncer- tainty estimation","work_id":"f7fac0d1-8ac1-486a-87b5-4d22a817228e","ref_index":5,"cited_arxiv_id":"","is_internal_anchor":false}],"resolved_work":90,"snapshot_sha256":"6010e49eb71a43591db1abd6d38a32e9cd4ff6312de8c020772561e0e2493886","internal_anchors":6},"formal_canon":{"evidence_count":2,"snapshot_sha256":"4a0c778505ba8fb9c006c462ab22c5188ef04cac0c44d4a854699fbde2ef49b8"},"author_claims":{"count":0,"strong_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"builder_version":"pith-number-builder-2026-05-17-v1"},"aliases":[{"alias_kind":"arxiv","alias_value":"1903.11027","created_at":"2026-05-17T23:38:13.991173+00:00"},{"alias_kind":"arxiv_version","alias_value":"1903.11027v5","created_at":"2026-05-17T23:38:13.991173+00:00"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.1903.11027","created_at":"2026-05-17T23:38:13.991173+00:00"},{"alias_kind":"pith_short_12","alias_value":"UU7EXWUW64DL","created_at":"2026-05-18T12:33:30.264802+00:00"},{"alias_kind":"pith_short_16","alias_value":"UU7EXWUW64DLAQWO","created_at":"2026-05-18T12:33:30.264802+00:00"},{"alias_kind":"pith_short_8","alias_value":"UU7EXWUW","created_at":"2026-05-18T12:33:30.264802+00:00"}],"events":[],"event_summary":{},"paper_claims":[],"inbound_citations":{"count":21,"internal_anchor_count":21,"sample":[{"citing_arxiv_id":"1907.07061","citing_title":"How much real data do we actually need: Analyzing object detection performance using synthetic and real data","ref_index":1,"is_internal_anchor":true},{"citing_arxiv_id":"2503.17182","citing_title":"Radar-Guided Polynomial Fitting for Metric Depth Estimation","ref_index":6,"is_internal_anchor":true},{"citing_arxiv_id":"2605.02098","citing_title":"From Spherical to Gaussian: A Comparative Analysis of Point Cloud Cropping Strategies in Large-Scale 3D Environments","ref_index":58,"is_internal_anchor":true},{"citing_arxiv_id":"2506.05442","citing_title":"Structured Labeling Enables Faster Vision-Language Models for End-to-End Autonomous Driving","ref_index":37,"is_internal_anchor":true},{"citing_arxiv_id":"2602.22801","citing_title":"Unleashing the Potential of Diffusion Models for End-to-End Autonomous Driving","ref_index":7,"is_internal_anchor":true},{"citing_arxiv_id":"2512.15369","citing_title":"SemanticBridge - A Dataset for 3D Semantic Segmentation of Bridges and Domain Gap Analysis","ref_index":30,"is_internal_anchor":true},{"citing_arxiv_id":"2605.14696","citing_title":"EponaV2: Driving World Model with Comprehensive Future Reasoning","ref_index":4,"is_internal_anchor":true},{"citing_arxiv_id":"2604.02930","citing_title":"BEVPredFormer: Spatio-temporal Attention for BEV Instance Prediction in Autonomous Driving","ref_index":35,"is_internal_anchor":true},{"citing_arxiv_id":"2604.03463","citing_title":"Super Agents and Confounders: Influence of surrounding agents on vehicle trajectory prediction","ref_index":14,"is_internal_anchor":true},{"citing_arxiv_id":"2605.12134","citing_title":"MULTI: Disentangling Camera Lens, Sensor, View, and Domain for Novel Image Generation","ref_index":7,"is_internal_anchor":true},{"citing_arxiv_id":"2605.11463","citing_title":"Encore: Conditioning Trajectory Forecasting via Biased Ego Rehearsals","ref_index":54,"is_internal_anchor":true},{"citing_arxiv_id":"2605.03491","citing_title":"Real-Time Evaluation of Autonomous Systems under Adversarial Attacks","ref_index":9,"is_internal_anchor":true},{"citing_arxiv_id":"2605.04355","citing_title":"InterFuserDVS: Event-Enhanced Sensor Fusion for Safe RL-Based Decision Making","ref_index":3,"is_internal_anchor":true},{"citing_arxiv_id":"2604.19411","citing_title":"GOLD-BEV: GrOund and aeriaL Data for Dense Semantic BEV Mapping of Dynamic Scenes","ref_index":5,"is_internal_anchor":true},{"citing_arxiv_id":"2604.11081","citing_title":"MapATM: Enhancing HD Map Construction through Actor Trajectory Modeling","ref_index":1,"is_internal_anchor":true},{"citing_arxiv_id":"2604.08626","citing_title":"WildDet3D: Scaling Promptable 3D Detection in the Wild","ref_index":8,"is_internal_anchor":true},{"citing_arxiv_id":"2403.12945","citing_title":"DROID: A Large-Scale In-The-Wild Robot Manipulation Dataset","ref_index":4,"is_internal_anchor":true},{"citing_arxiv_id":"2604.13128","citing_title":"Learning Probabilistic Responsibility Allocations for Multi-Agent Interactions","ref_index":9,"is_internal_anchor":true},{"citing_arxiv_id":"2604.22851","citing_title":"EgoDyn-Bench: Evaluating Ego-Motion Understanding in Vision-Centric Foundation Models for Autonomous Driving","ref_index":4,"is_internal_anchor":true},{"citing_arxiv_id":"2605.00907","citing_title":"TRIP-Evaluate: An Open Multimodal Benchmark for Evaluating Large Models in Transportation","ref_index":9,"is_internal_anchor":true},{"citing_arxiv_id":"2605.02098","citing_title":"From Spherical to Gaussian: A Comparative Analysis of Point Cloud Cropping Strategies in Large-Scale 3D Environments","ref_index":57,"is_internal_anchor":true}]},"formal_canon":{"evidence_count":2,"sample":[],"anchors":[]},"links":{"html":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI","json":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI.json","graph_json":"https://pith.science/api/pith-number/UU7EXWUW64DLAQWOEM3G6CFCHI/graph.json","events_json":"https://pith.science/api/pith-number/UU7EXWUW64DLAQWOEM3G6CFCHI/events.json","paper":"https://pith.science/paper/UU7EXWUW"},"agent_actions":{"view_html":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI","download_json":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI.json","view_paper":"https://pith.science/paper/UU7EXWUW","resolve_alias":"https://pith.science/api/pith-number/resolve?arxiv=1903.11027&json=true","fetch_graph":"https://pith.science/api/pith-number/UU7EXWUW64DLAQWOEM3G6CFCHI/graph.json","fetch_events":"https://pith.science/api/pith-number/UU7EXWUW64DLAQWOEM3G6CFCHI/events.json","actions":{"anchor_timestamp":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI/action/timestamp_anchor","attest_storage":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI/action/storage_attestation","attest_author":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI/action/author_attestation","sign_citation":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI/action/citation_signature","submit_replication":"https://pith.science/pith/UU7EXWUW64DLAQWOEM3G6CFCHI/action/replication_record"}},"created_at":"2026-05-17T23:38:13.991173+00:00","updated_at":"2026-05-17T23:38:13.991173+00:00"}