{"bundle_type":"pith_open_graph_bundle","bundle_version":"1.0","pith_number":"pith:2019:67BWXEGXETAZWOA5EP645JJCIK","short_pith_number":"pith:67BWXEGX","canonical_record":{"source":{"id":"1903.11774","kind":"arxiv","version":1},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2019-03-28T03:24:44Z","cross_cats_sorted":["cs.AI","stat.ML"],"title_canon_sha256":"91f2e0027e6f92f68f221e3c2a5888d8e7014ca948e32191f815ec869d280722","abstract_canon_sha256":"6e19a8a240e62a1128352acdd67abe7e37d45742b938386d614c9e6a24c169bf"},"schema_version":"1.0"},"canonical_sha256":"f7c36b90d724c19b381d23fdcea52242ba043882918d3225fc4d42d45adb96cb","source":{"kind":"arxiv","id":"1903.11774","version":1},"source_aliases":[{"alias_kind":"arxiv","alias_value":"1903.11774","created_at":"2026-05-17T23:50:01Z"},{"alias_kind":"arxiv_version","alias_value":"1903.11774v1","created_at":"2026-05-17T23:50:01Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.1903.11774","created_at":"2026-05-17T23:50:01Z"},{"alias_kind":"pith_short_12","alias_value":"67BWXEGXETAZ","created_at":"2026-05-18T12:33:10Z"},{"alias_kind":"pith_short_16","alias_value":"67BWXEGXETAZWOA5","created_at":"2026-05-18T12:33:10Z"},{"alias_kind":"pith_short_8","alias_value":"67BWXEGX","created_at":"2026-05-18T12:33:10Z"}],"events":[{"event_type":"record_created","subject_pith_number":"pith:2019:67BWXEGXETAZWOA5EP645JJCIK","target":"record","payload":{"canonical_record":{"source":{"id":"1903.11774","kind":"arxiv","version":1},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2019-03-28T03:24:44Z","cross_cats_sorted":["cs.AI","stat.ML"],"title_canon_sha256":"91f2e0027e6f92f68f221e3c2a5888d8e7014ca948e32191f815ec869d280722","abstract_canon_sha256":"6e19a8a240e62a1128352acdd67abe7e37d45742b938386d614c9e6a24c169bf"},"schema_version":"1.0"},"canonical_sha256":"f7c36b90d724c19b381d23fdcea52242ba043882918d3225fc4d42d45adb96cb","receipt":{"kind":"pith_receipt","key_id":"pith-v1-2026-05","algorithm":"ed25519","signed_at":"2026-05-17T23:50:01.829515Z","signature_b64":"PyeB3HblKr4tEW9mBxVHV6q4yZ7BrU1S+7POnw4JJifBEJQ1nCijIMBuTQuArbWH2HUSv8i8Yot4a54dNEOWDw==","signed_message":"canonical_sha256_bytes","builder_version":"pith-number-builder-2026-05-17-v1","receipt_version":"0.3","canonical_sha256":"f7c36b90d724c19b381d23fdcea52242ba043882918d3225fc4d42d45adb96cb","last_reissued_at":"2026-05-17T23:50:01.829060Z","signature_status":"signed_v1","first_computed_at":"2026-05-17T23:50:01.829060Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"source_kind":"arxiv","source_id":"1903.11774","source_version":1,"attestation_state":"computed"},"signer":{"signer_id":"pith.science","signer_type":"pith_registry","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"created_at":"2026-05-17T23:50:01Z","supersedes":[],"prev_event":null,"signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"vkx+BLps4QHsi04YMmm70Hd4J1dR/Re/JQxtpfPNyjROEAV6FnlmWVG+0bXnoHgM6evLZAN4q6Tb9dBX68JjAQ==","signed_message":"open_graph_event_sha256_bytes","signed_at":"2026-05-23T16:43:36.858671Z"},"content_sha256":"0f2ae04fa2f17d21de4c96b3b783e95f2b8029dab4c0bffd1db5081c4e5d1bb8","schema_version":"1.0","event_id":"sha256:0f2ae04fa2f17d21de4c96b3b783e95f2b8029dab4c0bffd1db5081c4e5d1bb8"},{"event_type":"graph_snapshot","subject_pith_number":"pith:2019:67BWXEGXETAZWOA5EP645JJCIK","target":"graph","payload":{"graph_snapshot":{"paper":{"title":"How to pick the domain randomization parameters for sim-to-real transfer of reinforcement learning policies?","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","headline":"","cross_cats":["cs.AI","stat.ML"],"primary_cat":"cs.LG","authors_text":"Hao Su, Henrik I. Christensen, Quan Vuong, Sharad Vikram, Sicun Gao","submitted_at":"2019-03-28T03:24:44Z","abstract_excerpt":"Recently, reinforcement learning (RL) algorithms have demonstrated remarkable success in learning complicated behaviors from minimally processed input. However, most of this success is limited to simulation. While there are promising successes in applying RL algorithms directly on real systems, their performance on more complex systems remains bottle-necked by the relative data inefficiency of RL algorithms. Domain randomization is a promising direction of research that has demonstrated impressive results using RL algorithms to control real robots. At a high level, domain randomization works b"},"claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"1903.11774","kind":"arxiv","version":1},"verdict":{"id":null,"model_set":{},"created_at":null,"strongest_claim":"","one_line_summary":"","pipeline_version":null,"weakest_assumption":"","pith_extraction_headline":""},"references":{"count":0,"sample":[],"resolved_work":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","internal_anchors":0},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"author_claims":{"count":0,"strong_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"builder_version":"pith-number-builder-2026-05-17-v1"},"verdict_id":null},"signer":{"signer_id":"pith.science","signer_type":"pith_registry","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"created_at":"2026-05-17T23:50:01Z","supersedes":[],"prev_event":null,"signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"n10v0Lvvv1Bm5wB8fVos2w4ejo6sexFCXcgA5Sbl8aKeV/7i410ekcMoM/PBzFPX3i1i25E/yXj2R7IJpV9qDw==","signed_message":"open_graph_event_sha256_bytes","signed_at":"2026-05-23T16:43:36.859371Z"},"content_sha256":"00fd71572b13428cb93dc363bb7a56e3cc20329a4fb5d872fbc05ea6ec9d184d","schema_version":"1.0","event_id":"sha256:00fd71572b13428cb93dc363bb7a56e3cc20329a4fb5d872fbc05ea6ec9d184d"}],"timestamp_proofs":[],"mirror_hints":[{"mirror_type":"https","name":"Pith Resolver","base_url":"https://pith.science","bundle_url":"https://pith.science/pith/67BWXEGXETAZWOA5EP645JJCIK/bundle.json","state_url":"https://pith.science/pith/67BWXEGXETAZWOA5EP645JJCIK/state.json","well_known_bundle_url":"https://pith.science/.well-known/pith/67BWXEGXETAZWOA5EP645JJCIK/bundle.json","status":"primary"}],"public_keys":[{"key_id":"pith-v1-2026-05","algorithm":"ed25519","format":"raw","public_key_b64":"stVStoiQhXFxp4s2pdzPNoqVNBMojDU/fJ2db5S3CbM=","public_key_hex":"b2d552b68890857171a78b36a5dccf368a953413288c353f7c9d9d6f94b709b3","fingerprint_sha256_b32_first128bits":"RVFV5Z2OI2J3ZUO7ERDEBCYNKS","fingerprint_sha256_hex":"8d4b5ee74e4693bcd1df2446408b0d54","rotates_at":null,"url":"https://pith.science/pith-signing-key.json","notes":"Pith uses this Ed25519 key to sign canonical record SHA-256 digests. Verify with: ed25519_verify(public_key, message=canonical_sha256_bytes, signature=base64decode(signature_b64))."}],"merge_version":"pith-open-graph-merge-v1","built_at":"2026-05-23T16:43:36Z","links":{"resolver":"https://pith.science/pith/67BWXEGXETAZWOA5EP645JJCIK","bundle":"https://pith.science/pith/67BWXEGXETAZWOA5EP645JJCIK/bundle.json","state":"https://pith.science/pith/67BWXEGXETAZWOA5EP645JJCIK/state.json","well_known_bundle":"https://pith.science/.well-known/pith/67BWXEGXETAZWOA5EP645JJCIK/bundle.json"},"state":{"state_type":"pith_open_graph_state","state_version":"1.0","pith_number":"pith:2019:67BWXEGXETAZWOA5EP645JJCIK","merge_version":"pith-open-graph-merge-v1","event_count":2,"valid_event_count":2,"invalid_event_count":0,"equivocation_count":0,"current":{"canonical_record":{"metadata":{"abstract_canon_sha256":"6e19a8a240e62a1128352acdd67abe7e37d45742b938386d614c9e6a24c169bf","cross_cats_sorted":["cs.AI","stat.ML"],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2019-03-28T03:24:44Z","title_canon_sha256":"91f2e0027e6f92f68f221e3c2a5888d8e7014ca948e32191f815ec869d280722"},"schema_version":"1.0","source":{"id":"1903.11774","kind":"arxiv","version":1}},"source_aliases":[{"alias_kind":"arxiv","alias_value":"1903.11774","created_at":"2026-05-17T23:50:01Z"},{"alias_kind":"arxiv_version","alias_value":"1903.11774v1","created_at":"2026-05-17T23:50:01Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.1903.11774","created_at":"2026-05-17T23:50:01Z"},{"alias_kind":"pith_short_12","alias_value":"67BWXEGXETAZ","created_at":"2026-05-18T12:33:10Z"},{"alias_kind":"pith_short_16","alias_value":"67BWXEGXETAZWOA5","created_at":"2026-05-18T12:33:10Z"},{"alias_kind":"pith_short_8","alias_value":"67BWXEGX","created_at":"2026-05-18T12:33:10Z"}],"graph_snapshots":[{"event_id":"sha256:00fd71572b13428cb93dc363bb7a56e3cc20329a4fb5d872fbc05ea6ec9d184d","target":"graph","created_at":"2026-05-17T23:50:01Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"graph_snapshot":{"author_claims":{"count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","strong_count":0},"builder_version":"pith-number-builder-2026-05-17-v1","claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"paper":{"abstract_excerpt":"Recently, reinforcement learning (RL) algorithms have demonstrated remarkable success in learning complicated behaviors from minimally processed input. However, most of this success is limited to simulation. While there are promising successes in applying RL algorithms directly on real systems, their performance on more complex systems remains bottle-necked by the relative data inefficiency of RL algorithms. Domain randomization is a promising direction of research that has demonstrated impressive results using RL algorithms to control real robots. At a high level, domain randomization works b","authors_text":"Hao Su, Henrik I. Christensen, Quan Vuong, Sharad Vikram, Sicun Gao","cross_cats":["cs.AI","stat.ML"],"headline":"","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2019-03-28T03:24:44Z","title":"How to pick the domain randomization parameters for sim-to-real transfer of reinforcement learning policies?"},"references":{"count":0,"internal_anchors":0,"resolved_work":0,"sample":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"1903.11774","kind":"arxiv","version":1},"verdict":{"created_at":null,"id":null,"model_set":{},"one_line_summary":"","pipeline_version":null,"pith_extraction_headline":"","strongest_claim":"","weakest_assumption":""}},"verdict_id":null}}],"author_attestations":[],"timestamp_anchors":[],"storage_attestations":[],"citation_signatures":[],"replication_records":[],"corrections":[],"mirror_hints":[],"record_created":{"event_id":"sha256:0f2ae04fa2f17d21de4c96b3b783e95f2b8029dab4c0bffd1db5081c4e5d1bb8","target":"record","created_at":"2026-05-17T23:50:01Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"attestation_state":"computed","canonical_record":{"metadata":{"abstract_canon_sha256":"6e19a8a240e62a1128352acdd67abe7e37d45742b938386d614c9e6a24c169bf","cross_cats_sorted":["cs.AI","stat.ML"],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2019-03-28T03:24:44Z","title_canon_sha256":"91f2e0027e6f92f68f221e3c2a5888d8e7014ca948e32191f815ec869d280722"},"schema_version":"1.0","source":{"id":"1903.11774","kind":"arxiv","version":1}},"canonical_sha256":"f7c36b90d724c19b381d23fdcea52242ba043882918d3225fc4d42d45adb96cb","receipt":{"algorithm":"ed25519","builder_version":"pith-number-builder-2026-05-17-v1","canonical_sha256":"f7c36b90d724c19b381d23fdcea52242ba043882918d3225fc4d42d45adb96cb","first_computed_at":"2026-05-17T23:50:01.829060Z","key_id":"pith-v1-2026-05","kind":"pith_receipt","last_reissued_at":"2026-05-17T23:50:01.829060Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","receipt_version":"0.3","signature_b64":"PyeB3HblKr4tEW9mBxVHV6q4yZ7BrU1S+7POnw4JJifBEJQ1nCijIMBuTQuArbWH2HUSv8i8Yot4a54dNEOWDw==","signature_status":"signed_v1","signed_at":"2026-05-17T23:50:01.829515Z","signed_message":"canonical_sha256_bytes"},"source_id":"1903.11774","source_kind":"arxiv","source_version":1}}},"equivocations":[],"invalid_events":[],"applied_event_ids":["sha256:0f2ae04fa2f17d21de4c96b3b783e95f2b8029dab4c0bffd1db5081c4e5d1bb8","sha256:00fd71572b13428cb93dc363bb7a56e3cc20329a4fb5d872fbc05ea6ec9d184d"],"state_sha256":"b3bf3c91b1c42e9db976639384351b059d455ca2a93ac0d823db9a5430ed8963"},"bundle_signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"RR8Tt4LRfmgZf0JJalQnO6Jg2pGews6P7IaOQfcR/LQR3aQNWfTbLmZ24Q+lK4c+nlC7HeyjwndRvu/rDzi3AA==","signed_message":"bundle_sha256_bytes","signed_at":"2026-05-23T16:43:36.863449Z","bundle_sha256":"f2f2b8245a1e04d394c6182cb0ca05c3c96b5dc88bb5601733477dc0dcfa8d49"}}