{"bundle_type":"pith_open_graph_bundle","bundle_version":"1.0","pith_number":"pith:2026:ADY4ZJ3TVYZOAB5TR3BMSLP6WN","short_pith_number":"pith:ADY4ZJ3T","canonical_record":{"source":{"id":"2606.01160","kind":"arxiv","version":1},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.AI","submitted_at":"2026-05-31T11:06:48Z","cross_cats_sorted":[],"title_canon_sha256":"cb49f2d586edbb25c3e07dfd4dda36a6667682c2f692bebd157d65165f19816c","abstract_canon_sha256":"66517b534962b3d210f41a8760cdf1f83adcb5f921105bd04b86ac8ede2ea8cb"},"schema_version":"1.0"},"canonical_sha256":"00f1cca773ae32e007b38ec2c92dfeb35e52423aacd82369380ce0b23c46e014","source":{"kind":"arxiv","id":"2606.01160","version":1},"source_aliases":[{"alias_kind":"arxiv","alias_value":"2606.01160","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"arxiv_version","alias_value":"2606.01160v1","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.2606.01160","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"pith_short_12","alias_value":"ADY4ZJ3TVYZO","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"pith_short_16","alias_value":"ADY4ZJ3TVYZOAB5T","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"pith_short_8","alias_value":"ADY4ZJ3T","created_at":"2026-06-02T02:04:25Z"}],"events":[{"event_type":"record_created","subject_pith_number":"pith:2026:ADY4ZJ3TVYZOAB5TR3BMSLP6WN","target":"record","payload":{"canonical_record":{"source":{"id":"2606.01160","kind":"arxiv","version":1},"metadata":{"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.AI","submitted_at":"2026-05-31T11:06:48Z","cross_cats_sorted":[],"title_canon_sha256":"cb49f2d586edbb25c3e07dfd4dda36a6667682c2f692bebd157d65165f19816c","abstract_canon_sha256":"66517b534962b3d210f41a8760cdf1f83adcb5f921105bd04b86ac8ede2ea8cb"},"schema_version":"1.0"},"canonical_sha256":"00f1cca773ae32e007b38ec2c92dfeb35e52423aacd82369380ce0b23c46e014","receipt":{"kind":"pith_receipt","key_id":"pith-v1-2026-05","algorithm":"ed25519","signed_at":"2026-06-02T02:04:25.381642Z","signature_b64":"KWBDNuc6fR00OWqGitG2PYiiJ/kwpmYv9L6ARLKhHmsQ/iKv7Re1KDSdkb8RxJorBvV9UBMbyKucas22EhsrCA==","signed_message":"canonical_sha256_bytes","builder_version":"pith-number-builder-2026-05-17-v1","receipt_version":"0.3","canonical_sha256":"00f1cca773ae32e007b38ec2c92dfeb35e52423aacd82369380ce0b23c46e014","last_reissued_at":"2026-06-02T02:04:25.381194Z","signature_status":"signed_v1","first_computed_at":"2026-06-02T02:04:25.381194Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"source_kind":"arxiv","source_id":"2606.01160","source_version":1,"attestation_state":"computed"},"signer":{"signer_id":"pith.science","signer_type":"pith_registry","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"created_at":"2026-06-02T02:04:25Z","supersedes":[],"prev_event":null,"signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"GaoCN8bz+PtL7NO5AJ85gESkYxf5151oPjUDJAYcF7izTYFbUZrTNh2hjxLLkYdL/Y4/9dhMI9td4gGBO6LhCw==","signed_message":"open_graph_event_sha256_bytes","signed_at":"2026-06-22T16:00:10.082044Z"},"content_sha256":"d93e4bdf31ec67774e0e62495bdc6973496f373571a16fa805d7f4b2c07a217c","schema_version":"1.0","event_id":"sha256:d93e4bdf31ec67774e0e62495bdc6973496f373571a16fa805d7f4b2c07a217c"},{"event_type":"graph_snapshot","subject_pith_number":"pith:2026:ADY4ZJ3TVYZOAB5TR3BMSLP6WN","target":"graph","payload":{"graph_snapshot":{"paper":{"title":"Expected Value Alignment for Generative Reward Modeling in Formal Mathematics Verification","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","headline":"","cross_cats":[],"primary_cat":"cs.AI","authors_text":"Haotao Tan, Mingyu Li, Shihao Ji, Zihui Song","submitted_at":"2026-05-31T11:06:48Z","abstract_excerpt":"Large Language Models (LLMs) are increasingly used with formal interactive theorem provers such as Lean 4. Scaling these systems with reinforcement learning or search methods requires process reward models (PRMs) that can evaluate intermediate reasoning steps. Existing reward-model designs expose a practical trade-off. Value-head models provide continuous scores but modify the generative model interface, while generative reward models preserve textual rationales but are poorly matched to continuous floating-point regression because numeric values are split across tokens. We introduce Expected "},"claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"2606.01160","kind":"arxiv","version":1},"verdict":{"id":null,"model_set":{},"created_at":null,"strongest_claim":"","one_line_summary":"","pipeline_version":null,"weakest_assumption":"","pith_extraction_headline":""},"integrity":{"clean":true,"summary":{"advisory":0,"critical":0,"by_detector":{},"informational":0},"endpoint":"/pith/2606.01160/integrity.json","findings":[],"available":true,"detectors_run":[],"snapshot_sha256":"c28c3603d3b5d939e8dc4c7e95fa8dfce3d595e45f758748cecf8e644a296938"},"references":{"count":0,"sample":[],"resolved_work":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","internal_anchors":0},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"author_claims":{"count":0,"strong_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"builder_version":"pith-number-builder-2026-05-17-v1"},"verdict_id":null},"signer":{"signer_id":"pith.science","signer_type":"pith_registry","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"created_at":"2026-06-02T02:04:25Z","supersedes":[],"prev_event":null,"signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"EEQuTuw7/9MPLOxvVX/HFHM99gMYd8KSsYD87LkNHtSNpeZ8ohvTkQJBhdvKZWNuiOthL/4dzJZmUbDepI3pBQ==","signed_message":"open_graph_event_sha256_bytes","signed_at":"2026-06-22T16:00:10.082425Z"},"content_sha256":"1efc2d29a26d25e13ffd6eb7caa81be691adf36c661aa47615db3b93da58d580","schema_version":"1.0","event_id":"sha256:1efc2d29a26d25e13ffd6eb7caa81be691adf36c661aa47615db3b93da58d580"}],"timestamp_proofs":[],"mirror_hints":[{"mirror_type":"https","name":"Pith Resolver","base_url":"https://pith.science","bundle_url":"https://pith.science/pith/ADY4ZJ3TVYZOAB5TR3BMSLP6WN/bundle.json","state_url":"https://pith.science/pith/ADY4ZJ3TVYZOAB5TR3BMSLP6WN/state.json","well_known_bundle_url":"https://pith.science/.well-known/pith/ADY4ZJ3TVYZOAB5TR3BMSLP6WN/bundle.json","status":"primary"}],"public_keys":[{"key_id":"pith-v1-2026-05","algorithm":"ed25519","format":"raw","public_key_b64":"stVStoiQhXFxp4s2pdzPNoqVNBMojDU/fJ2db5S3CbM=","public_key_hex":"b2d552b68890857171a78b36a5dccf368a953413288c353f7c9d9d6f94b709b3","fingerprint_sha256_b32_first128bits":"RVFV5Z2OI2J3ZUO7ERDEBCYNKS","fingerprint_sha256_hex":"8d4b5ee74e4693bcd1df2446408b0d54","rotates_at":null,"url":"https://pith.science/pith-signing-key.json","notes":"Pith uses this Ed25519 key to sign canonical record SHA-256 digests. Verify with: ed25519_verify(public_key, message=canonical_sha256_bytes, signature=base64decode(signature_b64))."}],"merge_version":"pith-open-graph-merge-v1","built_at":"2026-06-22T16:00:10Z","links":{"resolver":"https://pith.science/pith/ADY4ZJ3TVYZOAB5TR3BMSLP6WN","bundle":"https://pith.science/pith/ADY4ZJ3TVYZOAB5TR3BMSLP6WN/bundle.json","state":"https://pith.science/pith/ADY4ZJ3TVYZOAB5TR3BMSLP6WN/state.json","well_known_bundle":"https://pith.science/.well-known/pith/ADY4ZJ3TVYZOAB5TR3BMSLP6WN/bundle.json"},"state":{"state_type":"pith_open_graph_state","state_version":"1.0","pith_number":"pith:2026:ADY4ZJ3TVYZOAB5TR3BMSLP6WN","merge_version":"pith-open-graph-merge-v1","event_count":2,"valid_event_count":2,"invalid_event_count":0,"equivocation_count":0,"current":{"canonical_record":{"metadata":{"abstract_canon_sha256":"66517b534962b3d210f41a8760cdf1f83adcb5f921105bd04b86ac8ede2ea8cb","cross_cats_sorted":[],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.AI","submitted_at":"2026-05-31T11:06:48Z","title_canon_sha256":"cb49f2d586edbb25c3e07dfd4dda36a6667682c2f692bebd157d65165f19816c"},"schema_version":"1.0","source":{"id":"2606.01160","kind":"arxiv","version":1}},"source_aliases":[{"alias_kind":"arxiv","alias_value":"2606.01160","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"arxiv_version","alias_value":"2606.01160v1","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.2606.01160","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"pith_short_12","alias_value":"ADY4ZJ3TVYZO","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"pith_short_16","alias_value":"ADY4ZJ3TVYZOAB5T","created_at":"2026-06-02T02:04:25Z"},{"alias_kind":"pith_short_8","alias_value":"ADY4ZJ3T","created_at":"2026-06-02T02:04:25Z"}],"graph_snapshots":[{"event_id":"sha256:1efc2d29a26d25e13ffd6eb7caa81be691adf36c661aa47615db3b93da58d580","target":"graph","created_at":"2026-06-02T02:04:25Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"graph_snapshot":{"author_claims":{"count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","strong_count":0},"builder_version":"pith-number-builder-2026-05-17-v1","claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"integrity":{"available":true,"clean":true,"detectors_run":[],"endpoint":"/pith/2606.01160/integrity.json","findings":[],"snapshot_sha256":"c28c3603d3b5d939e8dc4c7e95fa8dfce3d595e45f758748cecf8e644a296938","summary":{"advisory":0,"by_detector":{},"critical":0,"informational":0}},"paper":{"abstract_excerpt":"Large Language Models (LLMs) are increasingly used with formal interactive theorem provers such as Lean 4. Scaling these systems with reinforcement learning or search methods requires process reward models (PRMs) that can evaluate intermediate reasoning steps. Existing reward-model designs expose a practical trade-off. Value-head models provide continuous scores but modify the generative model interface, while generative reward models preserve textual rationales but are poorly matched to continuous floating-point regression because numeric values are split across tokens. We introduce Expected ","authors_text":"Haotao Tan, Mingyu Li, Shihao Ji, Zihui Song","cross_cats":[],"headline":"","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.AI","submitted_at":"2026-05-31T11:06:48Z","title":"Expected Value Alignment for Generative Reward Modeling in Formal Mathematics Verification"},"references":{"count":0,"internal_anchors":0,"resolved_work":0,"sample":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"2606.01160","kind":"arxiv","version":1},"verdict":{"created_at":null,"id":null,"model_set":{},"one_line_summary":"","pipeline_version":null,"pith_extraction_headline":"","strongest_claim":"","weakest_assumption":""}},"verdict_id":null}}],"author_attestations":[],"timestamp_anchors":[],"storage_attestations":[],"citation_signatures":[],"replication_records":[],"corrections":[],"mirror_hints":[],"record_created":{"event_id":"sha256:d93e4bdf31ec67774e0e62495bdc6973496f373571a16fa805d7f4b2c07a217c","target":"record","created_at":"2026-06-02T02:04:25Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"attestation_state":"computed","canonical_record":{"metadata":{"abstract_canon_sha256":"66517b534962b3d210f41a8760cdf1f83adcb5f921105bd04b86ac8ede2ea8cb","cross_cats_sorted":[],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.AI","submitted_at":"2026-05-31T11:06:48Z","title_canon_sha256":"cb49f2d586edbb25c3e07dfd4dda36a6667682c2f692bebd157d65165f19816c"},"schema_version":"1.0","source":{"id":"2606.01160","kind":"arxiv","version":1}},"canonical_sha256":"00f1cca773ae32e007b38ec2c92dfeb35e52423aacd82369380ce0b23c46e014","receipt":{"algorithm":"ed25519","builder_version":"pith-number-builder-2026-05-17-v1","canonical_sha256":"00f1cca773ae32e007b38ec2c92dfeb35e52423aacd82369380ce0b23c46e014","first_computed_at":"2026-06-02T02:04:25.381194Z","key_id":"pith-v1-2026-05","kind":"pith_receipt","last_reissued_at":"2026-06-02T02:04:25.381194Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","receipt_version":"0.3","signature_b64":"KWBDNuc6fR00OWqGitG2PYiiJ/kwpmYv9L6ARLKhHmsQ/iKv7Re1KDSdkb8RxJorBvV9UBMbyKucas22EhsrCA==","signature_status":"signed_v1","signed_at":"2026-06-02T02:04:25.381642Z","signed_message":"canonical_sha256_bytes"},"source_id":"2606.01160","source_kind":"arxiv","source_version":1}}},"equivocations":[],"invalid_events":[],"applied_event_ids":["sha256:d93e4bdf31ec67774e0e62495bdc6973496f373571a16fa805d7f4b2c07a217c","sha256:1efc2d29a26d25e13ffd6eb7caa81be691adf36c661aa47615db3b93da58d580"],"state_sha256":"04b23afaee97e07cc69fdeb00056671ea7008d72c38be22e1e85f7205adf7e80"},"bundle_signature":{"signature_status":"signed_v1","algorithm":"ed25519","key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signature_b64":"dm07Xhn2L6wEj4TUX0pebKI8ILOkR6eCTGHDyvg68Qny41ttbolvywvAhdH75DN61LKOhYpaXpXGiSR+DHtEBA==","signed_message":"bundle_sha256_bytes","signed_at":"2026-06-22T16:00:10.084257Z","bundle_sha256":"b15e77f4eb015e18946e5c25bff077c324b960611fc258b8976cee38e7503529"}}