{"bundle_type":"pith_open_graph_bundle","bundle_version":"1.0","pith_number":"pith:2018:TBOBY5MEY2RAQYD6VHKX7GXO3D","short_pith_number":"pith:TBOBY5ME","canonical_record":{"source":{"id":"1804.07779","kind":"arxiv","version":3},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2018-04-20T18:16:43Z","cross_cats_sorted":["cs.AI","stat.ML"],"title_canon_sha256":"17c363b907a55cf981857900f76ac19fc2e67c443aacc4d970efcfbd85994d36","abstract_canon_sha256":"3413c7ab54bed111053a4f82a1ee81094fb17024635d62852b9bc17a23b9a9bb"},"schema_version":"1.0"},"canonical_sha256":"985c1c7584c6a208607ea9d57f9aeed8ec787a182207e4d7efef9984f700617f","source":{"kind":"arxiv","id":"1804.07779","version":3},"source_aliases":[{"alias_kind":"arxiv","alias_value":"1804.07779","created_at":"2026-05-18T00:14:06Z"},{"alias_kind":"arxiv_version","alias_value":"1804.07779v3","created_at":"2026-05-18T00:14:06Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.1804.07779","created_at":"2026-05-18T00:14:06Z"},{"alias_kind":"pith_short_12","alias_value":"TBOBY5MEY2RA","created_at":"2026-05-18T12:32:53Z"},{"alias_kind":"pith_short_16","alias_value":"TBOBY5MEY2RAQYD6","created_at":"2026-05-18T12:32:53Z"},{"alias_kind":"pith_short_8","alias_value":"TBOBY5ME","created_at":"2026-05-18T12:32:53Z"}],"events":[{"event_type":"record_created","subject_pith_number":"pith:2018:TBOBY5MEY2RAQYD6VHKX7GXO3D","target":"record","payload":{"canonical_record":{"source":{"id":"1804.07779","kind":"arxiv","version":3},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2018-04-20T18:16:43Z","cross_cats_sorted":["cs.AI","stat.ML"],"title_canon_sha256":"17c363b907a55cf981857900f76ac19fc2e67c443aacc4d970efcfbd85994d36","abstract_canon_sha256":"3413c7ab54bed111053a4f82a1ee81094fb17024635d62852b9bc17a23b9a9bb"},"schema_version":"1.0"},"canonical_sha256":"985c1c7584c6a208607ea9d57f9aeed8ec787a182207e4d7efef9984f700617f","receipt":{"kind":"pith_receipt","key_id":"pith-v1-2026-05","algorithm":"ed25519","signed_at":"2026-05-18T00:14:06.105659Z","signature_b64":"1JQjM5jSa2WVD4NgmADYkoLUeLcu0cqQ6K3aWH/3mTS1sltASuahxiOvyOdyeVBrzQ/m5iC6MoFmJkdL11LXDA==","signed_message":"canonical_sha256_bytes","builder_version":"pith-number-builder-2026-05-17-v1","receipt_version":"0.3","canonical_sha256":"985c1c7584c6a208607ea9d57f9aeed8ec787a182207e4d7efef9984f700617f","last_reissued_at":"2026-05-18T00:14:06.104959Z","signature_status":"signed_v1","first_computed_at":"2026-05-18T00:14:06.104959Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"source_kind":"arxiv","source_id":"1804.07779","source_version":3,"attestation_state":"computed"},"signer":{"signer_id":"pith.science","signer_type":"pith_registry","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"created_at":"2026-05-18T00:14:06Z","supersedes":[],"prev_event":null,"signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"A2sPuZUm975UyvZaSm8+mCnDm226qeAFkCLXzec8itxsx3Fmf/rPrmfVGOIVMzoVxG73VRxj6ImX/rsXLQ9MDg==","signed_message":"open_graph_event_sha256_bytes","signed_at":"2026-06-01T23:45:21.814553Z"},"content_sha256":"f47401133328263403984bca6e271880ea4c35f472df199a0e25fb98194d0df3","schema_version":"1.0","event_id":"sha256:f47401133328263403984bca6e271880ea4c35f472df199a0e25fb98194d0df3"},{"event_type":"graph_snapshot","subject_pith_number":"pith:2018:TBOBY5MEY2RAQYD6VHKX7GXO3D","target":"graph","payload":{"graph_snapshot":{"paper":{"title":"PEORL: Integrating Symbolic Planning and Hierarchical Reinforcement Learning for Robust Decision-Making","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","headline":"","cross_cats":["cs.AI","stat.ML"],"primary_cat":"cs.LG","authors_text":"Bo Liu, Daoming Lyu, Fangkai Yang, Steven Gustafson","submitted_at":"2018-04-20T18:16:43Z","abstract_excerpt":"Reinforcement learning and symbolic planning have both been used to build intelligent autonomous agents. Reinforcement learning relies on learning from interactions with real world, which often requires an unfeasibly large amount of experience. Symbolic planning relies on manually crafted symbolic knowledge, which may not be robust to domain uncertainties and changes. In this paper we present a unified framework {\\em PEORL} that integrates symbolic planning with hierarchical reinforcement learning (HRL) to cope with decision-making in a dynamic environment with uncertainties.\n  Symbolic plans "},"claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"1804.07779","kind":"arxiv","version":3},"verdict":{"id":null,"model_set":{},"created_at":null,"strongest_claim":"","one_line_summary":"","pipeline_version":null,"weakest_assumption":"","pith_extraction_headline":""},"references":{"count":0,"sample":[],"resolved_work":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","internal_anchors":0},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"author_claims":{"count":0,"strong_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"builder_version":"pith-number-builder-2026-05-17-v1"},"verdict_id":null},"signer":{"signer_id":"pith.science","signer_type":"pith_registry","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"created_at":"2026-05-18T00:14:06Z","supersedes":[],"prev_event":null,"signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"3liq+uvyq/c0qu+Ow5CwhMpu+0dJ968+tCzPicTKuIGMYE5onAr/IIlN+0kxORB0YUz3FxoxpFyOWU0tiCuICw==","signed_message":"open_graph_event_sha256_bytes","signed_at":"2026-06-01T23:45:21.814894Z"},"content_sha256":"5076bc9bc1d4b10c5a464e589b999518f3d92b137479db4918fd447b9e3cbf4e","schema_version":"1.0","event_id":"sha256:5076bc9bc1d4b10c5a464e589b999518f3d92b137479db4918fd447b9e3cbf4e"}],"timestamp_proofs":[],"mirror_hints":[{"mirror_type":"https","name":"Pith Resolver","base_url":"https://pith.science","bundle_url":"https://pith.science/pith/TBOBY5MEY2RAQYD6VHKX7GXO3D/bundle.json","state_url":"https://pith.science/pith/TBOBY5MEY2RAQYD6VHKX7GXO3D/state.json","well_known_bundle_url":"https://pith.science/.well-known/pith/TBOBY5MEY2RAQYD6VHKX7GXO3D/bundle.json","status":"primary"}],"public_keys":[{"key_id":"pith-v1-2026-05","algorithm":"ed25519","format":"raw","public_key_b64":"stVStoiQhXFxp4s2pdzPNoqVNBMojDU/fJ2db5S3CbM=","public_key_hex":"b2d552b68890857171a78b36a5dccf368a953413288c353f7c9d9d6f94b709b3","fingerprint_sha256_b32_first128bits":"RVFV5Z2OI2J3ZUO7ERDEBCYNKS","fingerprint_sha256_hex":"8d4b5ee74e4693bcd1df2446408b0d54","rotates_at":null,"url":"https://pith.science/pith-signing-key.json","notes":"Pith uses this Ed25519 key to sign canonical record SHA-256 digests. Verify with: ed25519_verify(public_key, message=canonical_sha256_bytes, signature=base64decode(signature_b64))."}],"merge_version":"pith-open-graph-merge-v1","built_at":"2026-06-01T23:45:21Z","links":{"resolver":"https://pith.science/pith/TBOBY5MEY2RAQYD6VHKX7GXO3D","bundle":"https://pith.science/pith/TBOBY5MEY2RAQYD6VHKX7GXO3D/bundle.json","state":"https://pith.science/pith/TBOBY5MEY2RAQYD6VHKX7GXO3D/state.json","well_known_bundle":"https://pith.science/.well-known/pith/TBOBY5MEY2RAQYD6VHKX7GXO3D/bundle.json"},"state":{"state_type":"pith_open_graph_state","state_version":"1.0","pith_number":"pith:2018:TBOBY5MEY2RAQYD6VHKX7GXO3D","merge_version":"pith-open-graph-merge-v1","event_count":2,"valid_event_count":2,"invalid_event_count":0,"equivocation_count":0,"current":{"canonical_record":{"metadata":{"abstract_canon_sha256":"3413c7ab54bed111053a4f82a1ee81094fb17024635d62852b9bc17a23b9a9bb","cross_cats_sorted":["cs.AI","stat.ML"],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2018-04-20T18:16:43Z","title_canon_sha256":"17c363b907a55cf981857900f76ac19fc2e67c443aacc4d970efcfbd85994d36"},"schema_version":"1.0","source":{"id":"1804.07779","kind":"arxiv","version":3}},"source_aliases":[{"alias_kind":"arxiv","alias_value":"1804.07779","created_at":"2026-05-18T00:14:06Z"},{"alias_kind":"arxiv_version","alias_value":"1804.07779v3","created_at":"2026-05-18T00:14:06Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.1804.07779","created_at":"2026-05-18T00:14:06Z"},{"alias_kind":"pith_short_12","alias_value":"TBOBY5MEY2RA","created_at":"2026-05-18T12:32:53Z"},{"alias_kind":"pith_short_16","alias_value":"TBOBY5MEY2RAQYD6","created_at":"2026-05-18T12:32:53Z"},{"alias_kind":"pith_short_8","alias_value":"TBOBY5ME","created_at":"2026-05-18T12:32:53Z"}],"graph_snapshots":[{"event_id":"sha256:5076bc9bc1d4b10c5a464e589b999518f3d92b137479db4918fd447b9e3cbf4e","target":"graph","created_at":"2026-05-18T00:14:06Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"graph_snapshot":{"author_claims":{"count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","strong_count":0},"builder_version":"pith-number-builder-2026-05-17-v1","claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"paper":{"abstract_excerpt":"Reinforcement learning and symbolic planning have both been used to build intelligent autonomous agents. Reinforcement learning relies on learning from interactions with real world, which often requires an unfeasibly large amount of experience. Symbolic planning relies on manually crafted symbolic knowledge, which may not be robust to domain uncertainties and changes. In this paper we present a unified framework {\\em PEORL} that integrates symbolic planning with hierarchical reinforcement learning (HRL) to cope with decision-making in a dynamic environment with uncertainties.\n  Symbolic plans ","authors_text":"Bo Liu, Daoming Lyu, Fangkai Yang, Steven Gustafson","cross_cats":["cs.AI","stat.ML"],"headline":"","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2018-04-20T18:16:43Z","title":"PEORL: Integrating Symbolic Planning and Hierarchical Reinforcement Learning for Robust Decision-Making"},"references":{"count":0,"internal_anchors":0,"resolved_work":0,"sample":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"1804.07779","kind":"arxiv","version":3},"verdict":{"created_at":null,"id":null,"model_set":{},"one_line_summary":"","pipeline_version":null,"pith_extraction_headline":"","strongest_claim":"","weakest_assumption":""}},"verdict_id":null}}],"author_attestations":[],"timestamp_anchors":[],"storage_attestations":[],"citation_signatures":[],"replication_records":[],"corrections":[],"mirror_hints":[],"record_created":{"event_id":"sha256:f47401133328263403984bca6e271880ea4c35f472df199a0e25fb98194d0df3","target":"record","created_at":"2026-05-18T00:14:06Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"attestation_state":"computed","canonical_record":{"metadata":{"abstract_canon_sha256":"3413c7ab54bed111053a4f82a1ee81094fb17024635d62852b9bc17a23b9a9bb","cross_cats_sorted":["cs.AI","stat.ML"],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.LG","submitted_at":"2018-04-20T18:16:43Z","title_canon_sha256":"17c363b907a55cf981857900f76ac19fc2e67c443aacc4d970efcfbd85994d36"},"schema_version":"1.0","source":{"id":"1804.07779","kind":"arxiv","version":3}},"canonical_sha256":"985c1c7584c6a208607ea9d57f9aeed8ec787a182207e4d7efef9984f700617f","receipt":{"algorithm":"ed25519","builder_version":"pith-number-builder-2026-05-17-v1","canonical_sha256":"985c1c7584c6a208607ea9d57f9aeed8ec787a182207e4d7efef9984f700617f","first_computed_at":"2026-05-18T00:14:06.104959Z","key_id":"pith-v1-2026-05","kind":"pith_receipt","last_reissued_at":"2026-05-18T00:14:06.104959Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","receipt_version":"0.3","signature_b64":"1JQjM5jSa2WVD4NgmADYkoLUeLcu0cqQ6K3aWH/3mTS1sltASuahxiOvyOdyeVBrzQ/m5iC6MoFmJkdL11LXDA==","signature_status":"signed_v1","signed_at":"2026-05-18T00:14:06.105659Z","signed_message":"canonical_sha256_bytes"},"source_id":"1804.07779","source_kind":"arxiv","source_version":3}}},"equivocations":[],"invalid_events":[],"applied_event_ids":["sha256:f47401133328263403984bca6e271880ea4c35f472df199a0e25fb98194d0df3","sha256:5076bc9bc1d4b10c5a464e589b999518f3d92b137479db4918fd447b9e3cbf4e"],"state_sha256":"713e6e370f075a6acb0b9d71558f24f7d3b032128bfdad6ce27b2d347bea0715"},"bundle_signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"ne0bE95Y4ziBPGPwAlmtAsLqsbxm1z1buv3ySDpGd24KiP+DYxmQBQ9mzA5XofQu9oXqSmZ1qgkt0FHRXyTMAA==","signed_message":"bundle_sha256_bytes","signed_at":"2026-06-01T23:45:21.816749Z","bundle_sha256":"b8b0580dc9537f62b141971ea77ce17599334a247d4f9fa59294e680f2d20ede"}}