P1_RC_GGL: Een strikte sluitingstest van sterrenstelseldynamica en zwakke lenswerking (rotatiekrommen + GGL)
EFT-kader voor gemiddelde zwaartekracht versus de minimale NFW-basislijn voor koude donkere materie (DM)
Raadpleeg het oorspronkelijke evaluatierapport:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 Managementsamenvatting
Dit rapport is een publicatieklare archiefeditie die op Zenodo is gedeponeerd. Het biedt een geïntegreerde, controleerbare keten die data, de modelboekhouding, eerlijke vergelijking, sluitingstests en reproduceerbaarheidsmateriaal omvat. Appendix B (P1A) dient als robuustheidssupplement. Het richt zich op stresstests met een “meer standaard DM-basislijn + één belangrijke systematische lensingterm”, om te beoordelen hoe gevoelig de hoofdconclusies zijn voor realistischer DM-modellering en behandeling van lensing-systematiek.
Kernconclusies (vier rechtstreeks citeerbare uitspraken; zie paragraaf 2.4):
(1) Bij het fitten van rotatiekrommen (RC) presteert de EFT-familie onder alle kernel/prior-combinaties duidelijk beter dan DM_RAZOR; een typische verbetering is Δlog𝓛_RC ≈ 10^3 (zie tabel S1a).
(2) In de RC→GGL-sluitingstest toont EFT een sterkere overdraagbaarheid tussen sondes: de sluitingssterkte Δlog𝓛_closure (True−Perm) ligt aanzienlijk hoger dan die van DM_RAZOR, en het verschil blijft robuust onder covariance shrinkage, R_min- en σ_int-scans (zie fig. S3 en tabel S1b).
(3) In de gezamenlijke fit (RC+GGL) behoudt EFT een stabiel voordeel; onder de negatieve controle die de gedeelde mapping verbreekt, stort dit voordeel in, wat ondersteunt dat het “gemiddelde-zwaartekrachteffect” voortkomt uit de gedeelde mapping en niet uit een toevallige fit (zie fig. S4).
(4) Zonder de dimensionaliteit wezenlijk te vergroten, voert Appendix B (P1A) een stresstest uit op de DM-kant met meer standaard DM-baseline-modules en één belangrijke nuisance voor lensing-systematiek. Deze uitbreidingen nemen het sluitingsvoordeel van EFT niet weg (zie tabel B1 en fig. B1).
Beschikbaarheid van data en code: rapport Concept DOI 10.5281/zenodo.18526334; volledig reproductiepakket Concept DOI 10.5281/zenodo.18526286. De tags die bij Appendix B (P1A) horen zijn run_tag=20260213_151233, closure_tag=20260213_161731 en joint_tag=20260213_195428.
1 Samenvatting
Wij voeren een reproduceerbare kwantitatieve vergelijking uit van twee theoretische kaders onder dezelfde data en hetzelfde statistische protocol: het model voor “gemiddelde-zwaartekrachtcorrectie” dat door de Energiedraadtheorie (Energy Filament Theory, EFT; niet te verwarren met de gebruikelijke afkorting voor effective field theory) wordt voorgesteld, en een baseline-halomodel voor koude donkere materie (DM) met NFW-profiel (DM_RAZOR). DM_RAZOR is bewust gekozen als een “minimale DM-basislijn”: een NFW-halo met vaste c–M-relatie (zonder halo-tot-halo-scatter), bedoeld als een controle die controleerbaar en reproduceerbaar is. Daarbij moet worden benadrukt dat dit artikel EFT behandelt als een fenomenologische, MOND-achtige parametrisatie van effectieve velden/effectieve respons voor toetsing binnen een uniform statistisch protocol, en niet als een afleiding van haar microscopische eerste principes binnen dit werk.
De data bestaan uit 2.295 snelheidsdatapunten uit SPARC-rotatiekrommen (RC), uniform voorbewerkt en gebind (104 sterrenstelsels, 20 RC-bins), samen met de KiDS-1000 overtollige oppervlakdichtheid ΔΣ(R) uit zwakke lenswerking tussen sterrenstelsels (GGL) (4 stellaire-massabins × 15 R-punten per bin, in totaal 60 punten, met gebruik van de volledige covariantie).
Wij voeren achtereenvolgens RC-only-inferentie, een RC→GGL-sluitingstest, GGL-only-inferentie en gezamenlijke RC+GGL-inferentie uit, met consistentie-audits om te garanderen dat elke geciteerde numerieke waarde herleidbaar is. Onder een strikte parameterboekhouding en gedeelde-mappingbeperkingen (DM: 20 log M200_bin-parameters; EFT: 20 log V0_bin-parameters + 1 globale log ℓ) presteert de EFT-familie in de gezamenlijke fit duidelijk beter dan DM_RAZOR: ΔlogL_total = 1155–1337 ten opzichte van DM_RAZOR. Belangrijker nog: de sluitingstest laat zien dat de RC-posterior niet-triviale voorspellende kracht heeft voor GGL: de sluitingssterkte van EFT is ΔlogL_closure = 172–281, hoger dan de 127 van DM_RAZOR. Wanneer de RC-bin→GGL-bin-groepering willekeurig wordt geschud, stort het sluitingssignaal in tot 6–23, wat bevestigt dat het signaal geen statistisch toeval of implementatieartefact is. Over systematische scans van σ_int, R_min en covariance shrinkage blijft het relatieve voordeel van EFT positief en stabiel van orde. Om veelgehoorde zorgen te adresseren dat de “DM-basislijn te zwak is” of dat “systematiek voor fysica wordt aangezien”, biedt Appendix B (P1A) een meer standaard maar nog steeds laag-dimensionale en controleerbare stresstest van de DM-basislijn, inclusief hiërarchische c–M-scatter + prior, een één-parameter core-proxy, lensing m en het gecombineerde DM_STD-model. Onder hetzelfde sluitingsprotocol nemen deze uitbreidingen het sluitingsvoordeel van EFT niet weg (zie tabel B1/fig. B1).
Trefwoorden: rotatiekrommen; zwakke lenswerking tussen sterrenstelsels; sluitingstest; EFT; koude donkere materie; Bayesiaanse inferentie
2 Inleiding en overzicht van de resultaten
Rotatiekrommen (RC) en zwakke lenswerking tussen sterrenstelsels (GGL) zijn twee complementaire zwaartekrachtsondes: RC begrenst de dynamische potentiaal en de radiale-versnellingsrelatie (RAR) in het schijfvlak, terwijl GGL de geprojecteerde massaverdeling en de zwaartekrachtsrespons op haloschaal meet. Voor elke kandidaat-theorie is de kernvraag niet of zij de twee datasets afzonderlijk kan fitten, maar of zij die onder dezelfde cross-data mapping en gedeelde beperkingen consistent kan verklaren.
Daarom neemt dit artikel de “sluitingstest” als kern van het statistische protocol: eerst wordt de RC-only-posterior gebruikt om GGL vooruit te voorspellen, daarna wordt dit vergeleken met een negatieve controle waarin de RC-bin→GGL-bin-mapping wordt gepermuteerd/geschud. Daarmee wordt de voorspellende overdraagbaarheid tussen datasets geëvalueerd en worden valse signalen door implementatiebias of toevallig fitten uitgesloten.
Theoretische positionering en reikwijdte: dit artikel probeert geen microscopische eerste-principesafleiding van EFT (Energy Filament Theory) en geen relativistisch volledige formulering te geven. In plaats daarvan behandelen wij EFT als een laag-dimensionale, MOND-achtige parametrisatie van effectief veld/effectieve respons (beschreven door een kernel f(x) en een globale schaal ℓ), en testen wij via de RC→GGL-sluitingstest haar consistentie tussen datasets en haar voorspellende overdraagbaarheid onder een strikte parameterboekhouding.
Onderzoeksprogramma en reikwijdteverklaring: dit artikel maakt deel uit van een lopend P-reeksprogramma voor observationele retrieval. In bestaande data op sterrenstelselschaal zoeken wij naar twee mogelijke effectieve achtergrondbijdragen: (i) een “gemiddelde-zwaartekrachtvloer” die door een grofkorrelige gemiddelde gravitatiereactie kan worden beschreven, en (ii) een “stochastische/ruisvloer” die samenhangt met fluctuaties in microscopische processen. In dit artikel (P1) richten wij ons uitsluitend op de eerste: zonder enige hypothese over microscopische productiemechanismen te introduceren, gebruiken wij de RC→GGL-sluitingstest om observationele aanwijzingen voor een gemiddelde-zwaartekrachtvloer op te halen en deze onder een uniform controleprotocol te vergelijken met een controleerbare DM-basislijn. Als heuristisch fysisch beeld geldt dat, als kortlevende vrijheidsgraden bestaan, hun verval/annihilatie rustmassa kan omzetten in energie-impuls die door andere vrijheidsgraden wordt gedragen; op effectief niveau correspondeert dit natuurlijk met een ontbinding in “gemiddelde bijdrage + fluctuatiebijdrage”. Dit artikel modelleert dat microscopische beeld echter niet kwantitatief.
Om overinterpretatie te vermijden, zijn de grenzen van dit artikel als volgt:
• Wat dit artikel doet: onder strikte parameterboekhouding en gedeelde-mappingbeperkingen gebruikt het sluitingstests om voorspellende overdraagbaarheid tussen datasets te meten en een reproduceerbare vergelijking uit te voeren tussen de gemiddelde-zwaartekrachtsrespons van EFT en een DM-basislijn.
• Wat dit artikel niet doet: het bespreekt geen microscopische productiemechanismen, abundanties/levensduren of kosmologische beperkingen; het modelleert de stochastische term die met de “ruisvloer” overeenkomt niet.
• Wat dit artikel niet claimt: het heeft niet als doel donkere materie omver te werpen; P1 geeft geen eindvonnis over de vraag of een “vloer” bestaat, maar rapporteert bewijs op faseniveau — dat binnen het hier geselecteerde robuuste meetdomein de data modellen begunstigen die een gemiddelde gravitatiereactie bevatten.
Tegelijkertijd maken wij duidelijk dat DM_RAZOR slechts een minimale en controleerbare NFW-basislijn vertegenwoordigt (vaste c–M en geen scatter; geen adiabatische contractie, feedback-core, niet-bolvormigheid of omgevingstermen). Daarom is de hoofdconclusie in de hoofdtekst strikt beperkt tot deze uitspraak: onder de minimale basislijn en de strikte parameterboekhouding/mappingbeperkingen toont EFT een sterkere consistentie tussen datasets. Om de veelvoorkomende vraag te beantwoorden of een meer standaard ΛCDM-basislijn en belangrijke modellering van lensing-systematiek de conclusie wezenlijk zouden veranderen, verzamelen wij meer standaard maar nog steeds laag-dimensionale en controleerbare DM-uitbreidingen en een lensing-side nuisance in Appendix B (P1A: standaardisatiestresstest van de DM-basislijn), terwijl precies dezelfde gedeelde mapping en hetzelfde sluitingstestprotocol als in de hoofdtekst behouden blijven (zie tabel B1/fig. B1).
2.1 Tab S1a–S1b: samenvatting van kernindicatoren (Strict)
Tabel S1a rapporteert de belangrijkste vergelijkingsindicatoren voor de gezamenlijke fit (RC+GGL): logL, ΔlogL, AICc en BIC. Tabel S1b rapporteert indicatoren voor de sluitingstest en robuustheidsscans: sluiting, shuffle-negatieve controle en de scanbereiken voor σ_int / R_min / cov-shrink. Alle waarden komen uit de strikte master-samenvattingstabel Tab_Z1_master_summary en kunnen in het release-archiefpakket item voor item worden herleid.
Tabel S1a | Belangrijkste vergelijkingsindicatoren voor de gezamenlijke fit (RC+GGL, Strict).
Model (werkruimte) | W-kernel | k | Gezamenlijke logL_total (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Tabel S1b | Sluiting en robuustheidsindicatoren (Strict).
Model (werkruimte) | Sluiting ΔlogL (true-perm) | ΔlogL van negatieve controle na shuffle | σ_int-scan ΔlogL-bereik | R_min-scan ΔlogL-bereik | cov-shrink-scan ΔlogL-bereik |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Fig. S3: sluitingssterkte (RC-only → voorspelde GGL)
Sluitingssterkte wordt gedefinieerd als ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: op RC-only posterior-samples wordt GGL vooruit voorspeld en vergeleken met een negatieve controle waarin de RC-bin→GGL-bin-mapping is gepermuteerd.

Fig. S3 | Sluitingssterkte (hoger is beter): gemiddeld log-likelihoodvoordeel van RC-only → GGL-voorspelling.
2.3 Fig. S4: hoofdvergelijking van de gezamenlijke fit (RC+GGL)
Het voordeel van de gezamenlijke fit wordt gedefinieerd als ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Onder dezelfde data, dezelfde mapping en vrijwel dezelfde parameterschaal bereikt de EFT-familie een aanzienlijk hogere gezamenlijke log-likelihood.

Fig. S4 | Voordeel van de gezamenlijke fit (hoger is beter): beste logL_total voor RC+GGL relatief ten opzichte van DM_RAZOR.
2.4 Vier conclusies (rechtstreeks citeerbaar)
(1) In een uniforme gezamenlijke analyse van SPARC-rotatiekrommen en KiDS-1000-zwakke lenswerking presteert het EFT-model voor gemiddelde zwaartekracht onder een strikt controleprotocol systematisch beter dan DM_RAZOR: ΔlogL_total = 1155–1337 ten opzichte van DM_RAZOR.
(2) De RC→GGL-sluitingstest toont een sterkere voorspellende consistentie voor EFT: ΔlogL_closure = 172–281, tegenover 127 voor DM_RAZOR. Wanneer de RC-bin→GGL-bin-groepering willekeurig wordt geschud, stort het sluitingssignaal in tot 6–23, wat aangeeft dat het signaal afhankelijk is van de juiste cross-data mapping en niet van toevallig fitten.
(3) Systematische scans van σ_int, R_min en covariance shrinkage veranderen noch het teken noch de schaal van “EFT presteert beter dan DM_RAZOR”, wat aangeeft dat de conclusie robuust is tegen gangbare systematische verstoringen.
(4) Onder hetzelfde sluitingsprotocol versterkt Appendix B (P1A) de DM-basislijn op een “gestandaardiseerde en controleerbare” manier: zij behoudt drie één-parameteruitbreidingen (SCAT/AC/FB) en voegt hiërarchische c–M-scatter + prior, een één-parameter core-proxy en een lensing-side shear-calibratie m toe (plus hun gecombineerde DM_STD-model). De resultaten laten zien dat alleen de feedback/core-tak een kleine nettoverbetering van de sluitingssterkte brengt (122.21→129.45, ΔΔlogL_closure≈+7.25); de overige uitbreidingen dragen onbeduidend of negatief bij aan de sluitingssterkte. De hoofdconclusie hangt dus niet af van het feit dat DM_RAZOR een te zwakke basislijn zou zijn.
3 Data en voorbewerking
Deze studie gebruikt twee openbare datasets. Binnen de engineering-workflow worden downloaden, checksumverificatie (sha256) en voorbewerking uitgevoerd met herleidbare scripts. Om een eerlijke vergelijking tussen modellen te waarborgen, delen alle werkruimten (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) exact dezelfde dataproducten en bin-mappings.
3.1 Rotatiekrommen (RC, SPARC)
De RC-data komen uit de Rotmod_LTG-bestanden van de SPARC-database (175 rotmod-bestanden). Na voorbewerking omvat de modelleringssteekproef 104 sterrenstelsels en 2.295 (r, V_obs)-datapunten, verdeeld over 20 RC-bins volgens stellaire massa en verwante criteria. Elk datapunt bevat straal r (kpc), waargenomen snelheid V_obs (km/s), waarnemingsfout σ_obs en de component-snelheden van gas/schijf/bulge (V_gas, V_disk, V_bul).
3.2 Zwakke lenswerking (GGL, KiDS-1000 / Brouwer+2021)
De GGL-data gebruiken de overtollige oppervlakdichtheid ΔΣ(R) uit fig. 3 van Brouwer et al. (2021) op basis van KiDS-1000 (4 stellaire-massabins, 15 R-punten per bin), samen met de meegeleverde volledige covariantie. In de engineering-workflow wordt de oorspronkelijke long-form covariantie voor elke bin gereconstrueerd tot een 15×15-matrix, en Stage-B-audits verifiëren de dimensionale en numerieke redelijkheid.
3.3 RC-bin → GGL-bin-mapping en totale steekproefomvang
De 4 GGL-massabins en 20 RC-bins worden verbonden via een vaste mapping: elke GGL-bin correspondeert met 5 RC-bins, en RC-bin-bijdragen worden gewogen op basis van het aantal sterrenstelsels. Deze mapping blijft in alle modellen vast en vormt de kernbeperking voor eerlijke vergelijking in sluitingstest en gezamenlijke fit. De uiteindelijke gezamenlijke dataset bevat n_total = 2355 punten (RC=2295, GGL=60).
4 Modellen en statistische methoden
4.1 Minimale wiskundige specificatie voor EFT en DM (controleerbaar/toetsbaar)
Deze paragraaf geeft de minimale wiskundige specificatie die rechtstreeks met de implementatie correspondeert.
(a) Model voor rotatiekrommen (RC)
Voor elk RC-datapunt (r, V_obs, σ_obs) gebruiken wij componentsuperpositie: V_mod²(r) = V_bar²(r) + V_extra²(r). Hierbij geldt V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). De hoofdresultaten in dit artikel nemen Υ_d = Υ_b = 0.5 aan, in overeenstemming met empirische SPARC-aanbevelingen en nuttig om onnodige vrijheidsgraden te verminderen.
(b) EFT-gemiddelde-zwaartekrachtcorrectie (EFT)
De extra term van EFT wordt geparametriseerd in de vorm van “gemiddelde snelheid in het kwadraat”: V_extra²(r) = V0_bin² · f(r/ℓ). Hierbij is V0_bin de amplitudeparameter voor elke RC-bin (20 parameters), ℓ een globale schaal (1 parameter), en f(x) een dimensieloze kernelvormfunctie. De kernelvormen die in dit artikel worden vergeleken (geen ervan introduceert extra continue vrijheidsgraden) zijn:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (optionele controle) gaussian: f(x)=erf(x/√2) (niet opgenomen in de hoofdconclusieset)
Fysische motivatie (uitgebreid): EFT interpreteert de extra gravitatiereactie op sterrenstelselschaal als een effectieve respons die wordt verkregen door fijnere microscopische werkingen over eindige schalen grofkorrelig te middelen/schaalgemiddeld te nemen. In dit artikel veronderstellen wij geen specifiek microscopisch mechanisme; in plaats daarvan gebruiken wij een minimale en controleerbare parametrisatie voor gecontroleerde vergelijking en toetsing onder een uniform statistisch protocol.
Ter intuïtie kan de extra term in versnellingsvorm worden geschreven: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Wanneer r≫ℓ geldt f→1 en V_extra→V0_bin, wat een ongeveer vlakke extra snelheidsbijdrage in het buitengebied oplevert. Wanneer r≪ℓ en f(x)≈x, kan een karakteristieke versnellingsschaal a0,bin≈V0_bin²/ℓ worden ingevoerd (tot op een O(1)-factor van de kernelfunctie), wat een MOND-achtige intuïtie geeft voor de overgangsschaal van binnen- naar buitengebied.
De discrete kernelfamilie die hier wordt gebruikt (none/exponential/yukawa/powerlaw_tail) kan worden gezien als laag-dimensionale proxy’s voor verschillende “beginshellingen / overgangssnelheden / lange-afstandsstaarten” (bijvoorbeeld Yukawa-achtige afscherming tegenover een respons met langere staart). Zij worden gebruikt voor robuustheidsstresstests en niet om de modelruimte uit te putten. In de zwakke-lensingcomponent construeren wij uit V_avg(r) een effectieve omhullende massa en dichtheid, en projecteren die vervolgens om ΔΣ(R) te verkrijgen. Deze effectieve dichtheid moet worden begrepen als een effectieve beschrijving van de lenspotentiaal onder aannames van bolsymmetrie en zwakke-veld-mapping (volledige details zijn verplaatst naar Appendix A).
Alle bovenstaande kernelvormen voldoen aan f(x)→1 voor x→∞ (d.w.z. verzadiging V_extra²→V0²), terwijl zij voor x≪1 lineaire of sublineaire groei geven: bijvoorbeeld exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Daarom vertonen verschillende kernelvormen waarneembare verschillen in “beginshelling” op kleine straal, overgangssnelheid en buitenstaart, en kunnen zij worden onderscheiden door de gezamenlijke RC+GGL- en sluitingstests.
De EFT-voorspelling voor zwakke-lensing ΔΣ(R) wordt verkregen door uit V_avg(r) omhullende massa en dichtheid af te leiden, gevolgd door projectie-integralen: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, en ΔΣ(R)=Σ̄(<R)−Σ(R). De numerieke implementatie gebruikt een logaritmisch rooster en verfijnt dit adaptief in uitzonderingsgevallen om stabiliteit en reproduceerbaarheid te waarborgen.
(c) DM_RAZOR: NFW-halo-basislijn voor koude donkere materie
Tegelijkertijd maken wij duidelijk dat DM_RAZOR slechts een minimale, controleerbare NFW-basislijn vertegenwoordigt (vaste c–M en geen scatter; geen adiabatische contractie, feedback-core, niet-bolvormigheid of omgevingstermen). Om het risico van een “strawman baseline” te verkleinen, beweert dit artikel niet dat zulke effecten niet bestaan. In plaats daarvan worden zij in Appendix B (P1A) opgenomen als laag-dimensionale en controleerbare stresstests, inclusief hiërarchische behandeling van c–M-scatter, een core-proxy en een lensing-side nuisance voor shear-calibratie.
4.2 Modelboekhouding en eerlijke vergelijking (gedeelde parameters = definitie van sluiting)
Het aantal parameters in de hoofdvergelijkingsset is: DM_RAZOR k=20; EFT-familie k=21 (de extra parameter is de globale log ℓ). Alle modellen delen dezelfde RC-data, dezelfde GGL-data en covariantie, dezelfde RC-bin→GGL-bin-mapping, dezelfde baryonische termen en dezelfde eenheidsconversies. Daarnaast is de kernelvorm (none / exponential / yukawa / powerlaw_tail) een discrete keuze en introduceert zij geen extra continue parameter, zodat geen voordeel kan worden behaald door “één extra vrijheidsgraad”.
4.3 Likelihood, priors en sampler
De RC-likelihood is diagonaal Gaussiaans: σ_eff² = σ_obs² + σ_int². De hoofdresultaten fixeren σ_int=5 km/s, en Run-5 scant σ_int. De GGL-likelihood gebruikt voor elke bin een volledige-covariantie-Gaussverdeling: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Het gezamenlijke doel is logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). De priors coderen vooral fysisch haalbare grenzen (intervalbeperkingen op log ℓ, log V0 en log M200); wanneer vrije Υ en σ_int worden ingeschakeld, worden zwak-informatieve priors gebruikt (zie de implementatie en de configuratie van het releasepakket voor details).
De sampler gebruikt een adaptieve block-Metropolis random walk: bij elke stap wordt slechts een willekeurig subblok van de parameterruimte bijgewerkt om de acceptatiegraad in hoge dimensies te verbeteren, en de stapgrootte wordt licht aangepast via de acceptatiegraad binnen vensters (doelacceptatiegraad ongeveer 0.25). De hoofdresultaten gebruiken quick mode (instellingen zoals n_steps=800), en voor elke werkruimte worden trace-, residu- en PPC-figuren uitgevoerd voor handmatige en scriptmatige audit.
4.4 Sluitingstest en negatieve controle (definitie)
De sluitingstest (Run-2) test of de RC-only-posterior GGL kan voorspellen zonder GGL opnieuw te fitten. Concreet worden vanuit RC-only posterior-samples ΔΣ(R) voor 4 GGL-bins vooruit gegenereerd en wordt logL_true met de volledige covariantie berekend; vervolgens wordt de RC-bin→GGL-bin-groepsmapping willekeurig gepermuteerd om logL_perm te verkrijgen. Sluitingssterkte wordt gedefinieerd als ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Daarnaast groepeert Run-10 de 20 RC-bins willekeurig opnieuw in 4×5 (shuffle) en herberekent sluiting, om te testen hoe sterk het sluitingssignaal afhankelijk is van de juiste mapping.
5 Hoofdresultaten en interpretatie
5.1 Hoofdresultaten van de gezamenlijke fit (RC+GGL)
De beste logL_total uit de gezamenlijke fit en het relatieve voordeel ΔlogL_total (ten opzichte van DM_RAZOR) staan in tabel S1a en fig. S4. In de hoofdvergelijkingsset heeft EFT_BIN het grootste gezamenlijke voordeel (ΔlogL_total=1337.210), terwijl de andere EFT-kernelvormen eveneens aanzienlijke voordelen behouden (1154.827–1294.442). Onder informatiecriteria (AICc/BIC) presteert de EFT-familie ook duidelijk beter dan DM_RAZOR, wat aangeeft dat het voordeel niet voortkomt uit vertekening door het aantal parameters.
Opmerking: de belangrijkste bijdrage aan ΔlogL_total≈1337 komt uit de RC-term (ΔlogL_RC≈1065 in de gezamenlijke ontbinding, ongeveer 80%). Dit kan worden begrepen als een bescheiden verbetering van ongeveer Δχ²≈0.90 per punt over N=2295 RC-datapunten, die onder een diagonaal Gaussiaanse likelihood vanzelf optelt tot een voordeel van orde 10^3. Tegelijkertijd leveren GGL en de sluitingstest onafhankelijke cross-dataset-beperkingen, en de rangorde blijft stabiel onder stresstests met σ_int, R_min en cov-shrink (zie paragraaf 6 en tabel S1b).
5.2 Resultaten van de sluitingstest (RC-only → GGL)
De centrale sluitingstestgrootheid ΔlogL_closure wordt gerapporteerd in tabel S1b en fig. S3. De EFT-familie heeft sluitingssterktes van 171.977–280.513, hoger dan de 126.678 van DM_RAZOR. Dit betekent dat, zonder extra cross-data vrijheidsgraden toe te staan, de posterior-samples die EFT uit de RC-data verkrijgt, een sterkere overdraagbare voorspellende kracht hebben voor de GGL-data.
De negatieve controle ondersteunt de fysische relevantie van het sluitingssignaal verder: wanneer de RC-bin→GGL-bin-groepering willekeurig wordt geschud, daalt de sluitingssterkte van EFT naar 6–15 (met kleine verschillen tussen kernels), terwijl de oorspronkelijke sluitingssterkte 172–281 bedraagt. Deze “signaalinstorting” sluit valse voordelen door numerieke implementatie, eenheidsfouten of onjuiste covariantiebehandeling uit.

Fig. R1 | Negatieve controle: na shuffle-groepering daalt het sluitingssignaal aanzienlijk (geplot uit Tab_Z1-indicatoren).
5.3 Betekenis en grenzen van de resultaten
De conclusie van deze studie luidt: “onder deze dataset en dit protocol presteert de EFT-gemiddelde-zwaartekrachtcorrectie beter dan de geteste DM_RAZOR-basislijn.” Benadrukt moet worden dat de DM-kant slechts een minimale NFW-basislijn met een vaste c(M)-relatie gebruikt, zonder core-vorming, niet-bolvormigheid, omgevingstermen of complexere galaxy–halo-connection-modellen. Daarom claimt dit manuscript niet alle DM-modelfamilies uit te sluiten. In plaats daarvan biedt het een reproduceerbare, op sluitingstest gerichte controlebasislijn om te evalueren of RC en GGL consistent door dezelfde cross-data parameters en mapping kunnen worden verklaard.
Om deze veelvoorkomende zorg te adresseren, hebben wij een onafhankelijk uitbreidingsproject P1A voltooid (zie Appendix B). Zonder de gedeelde RC-bin→GGL-bin-mapping of het auditkader te wijzigen, versterkt het de DM-basislijn op een “gestandaardiseerde en controleerbare” manier: naast drie één-parameteruitbreidingen (SCAT/AC/FB) voegt het verder toe: (i) hiërarchische c–M-scatter + massa-concentratieprior (DM_HIER_CMSCAT), (ii) een één-parameter baryonische-feedback core-proxy (DM_CORE1P), en (iii) een weak-lensing-side shear-calibratie-nuisance m (DM_RAZOR_M), en rapporteert het een gecombineerd model DM_STD; EFT_BIN blijft behouden als controlereferentie.
• DM_RAZOR_SCAT (c–M-scatter) — introduceert de concentratie-scatterparameter σ_logc van halo tot halo om te testen of een vaste c(M) systematisch het verklarend vermogen van DM onderschat;
• DM_RAZOR_AC (Adiabatische Contractie) — gebruikt één parameter α_AC om continu te interpoleren tussen “geen contractie” en “standaardcontractie”, waarmee de neiging van baryonen om de binnenste halo te contraheren tegen minimale kosten wordt gevangen;
• DM_RAZOR_FB (Feedback/core) — gebruikt een coreschaal (bijv. log r_core) om te beschrijven hoe binnenste core-vorming rotatiekrommen onderdrukt, terwijl de NFW-benadering op zwakke-lensingschalen behouden blijft.
Het kwantitatieve P1A-scorebord staat in Appendix B, tabel B1 / fig. B1 (automatisch gegenereerd uit Tab_S1_P1A_scoreboard). In de sluitingsindicator geeft DM_RAZOR_FB een kleine nettoverbetering (122.21→129.45, +7.25), terwijl de andere uitbreidingen onbeduidend of negatief bijdragen aan de sluitingssterkte. Aan de kant van de gezamenlijke fit kunnen het toevoegen van een hiërarchische c–M-scatterprior (DM_HIER_CMSCAT) of het gecombineerde model (DM_STD) de gezamenlijke logL aanzienlijk verbeteren, maar zij verbeteren de sluitingssterkte niet. Dit suggereert dat zij vooral flexibiliteit in de gezamenlijke fit toevoegen en geen overdraagbaarheid tussen sondes. Daarom moet de kernconclusie van de hoofdtekst als volgt worden gelezen: onder strikte gedeelde-mapping- en sluitingstestbeperkingen komt EFT’s voordeel in cross-data consistentie niet voort uit het kiezen van een “te zwakke basislijn” aan de DM-kant. Het P1A-releasepakket dat bij Appendix B hoort (aanvullende tabellen/figuren en full_fit_runpack) zal als extra bestanden worden opgenomen onder dezelfde Zenodo Concept DOI als de full_fit_runpack voor dit artikel: https://doi.org/10.5281/zenodo.18526286.
6 Robuustheids- en controle-experimenten
6.1 σ_int-scan (Run-5)
Wij scannen systematisch de intrinsieke RC-spreiding σ_int en herhalen de gezamenlijke inferentie bij elke σ_int, waarbij ΔlogL_total ten opzichte van DM_RAZOR wordt berekend. De minimum-/maximumwaarden van ΔlogL_total voor elk model over het scanbereik worden gerapporteerd in tabel S1b.

Fig. R2 | Bereik van ΔlogL_total onder de σ_int-scan (hoger is beter).
6.2 R_min-scan (Run-6)
Om de impact te testen van systematiek in data uit het centrale gebied (zoals niet-cirkelvormige beweging, resolutie en onvoldoende baryonische modellering), passen wij R_min-drempelsneden toe op RC en herhalen de gezamenlijke inferentie. Het voordeel van de EFT-familie blijft onder de R_min-scan positief en stabiel van schaal.

Fig. R3 | Bereik van ΔlogL_total onder de R_min-scan (hoger is beter).
6.3 cov-shrink-scan (Run-7)
Om onzekerheid in de GGL-covariantie te testen, passen wij shrinkage toe op de covariantiematrix van elke massabin: C_α=(1−α)C+α·diag(C), en scannen α. De resultaten tonen dat het voordeel van de EFT-familie ongevoelig is voor deze behandeling.

Fig. R4 | Bereik van ΔlogL_total onder de cov-shrink-scan (hoger is beter).
6.4 Ablatieladder (Run-8)
Binnen EFT_BIN voeren wij geneste ablaties uit: van een minimaal model (zonder vrije parameters), via versies die slechts een klein aantal vrijheidsgraden behouden, tot het volledige model met 20-bin-amplitude + globale schaal. AICc/BIC tonen dat het volledige EFT_BIN-model sterk door de data wordt vereist.

Fig. R5 | EFT_BIN-ablatieladder (AICc; lager is beter).
6.5 Holdout-voorspelling (Run-9)
Wij voeren verder een leave-one-bin-out-test (LOO) uit: van de 4 GGL-massabins wordt telkens één bin buiten beschouwing gelaten; de inferentie wordt opnieuw uitgevoerd met de resterende bins (en alle RC), waarna de test-log-likelihood op de weggelaten bin wordt geëvalueerd. Samenvattende indicatoren staan in de aanvullende tabel Tab_R3_leave_one_bin_out (een Run-9-product; bestandspadpatronen staan in de lijst van sleutelproducten in paragraaf 8.2). De EFT-familie blijft zelfs in het slechtste weggelaten geval duidelijk superieur aan DM_RAZOR.

Fig. R6 | LOO: log-likelihoodverdeling voor de weggelaten bin (uit Run-9-producten).
6.6 Negatieve controle: RC-bin-shuffle (Run-10)
Run-10 groepeert de 20 RC-bins willekeurig opnieuw in 4×5 en herberekent sluiting terwijl de RC-only-posterior onveranderd blijft. De resultaten tonen dat, vergeleken met de oorspronkelijke mapping, shufflen zowel de gemiddelde sluitings-logL_true als ΔlogL_closure aanzienlijk verlaagt (zie tabel S1b en fig. R1), wat de interpreteerbaarheid van het sluitingssignaal verder ondersteunt.

Fig. R7 | Negatieve controle: shuffle-mapping veroorzaakt een duidelijke daling in de gemiddelde sluitings-logL_true (uit Run-10-producten).
7 Herleidbaarheid en consistentie-audit (provenance)
Alle numerieke waarden die in dit artikel worden geciteerd, kunnen item voor item worden herleid in de strikte samenvattingstabellen en auditrecords van het release-archief. Om de hoofdtekst leesbaarder te houden, is de volledige provenance-keten (taglijst, audittabellen, checksumlijst en verificatiemethode) verplaatst naar Appendix A.
8 Reproduceerbaarheid en Zenodo-archief
Verklaring over beschikbaarheid van data en code: de SPARC-rotatiekrommedata en de KiDS-1000-zwakke-lensingdata die in dit artikel worden gebruikt, zijn openbare datasets. Het publicatieklare rapport is gearchiveerd op Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), en het volledige reproductiepakket is gearchiveerd op Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Gedetailleerde uitvoeringsstappen, afhankelijkheidsomgeving, archiefinventaris en hash-verificatie-informatie staan in Appendix A; het ontwerp, de run-tags en de outputs van de standaardisatiestresstest van de DM-basislijn (P1A) staan in Appendix B.
Onder dezelfde Concept DOI voor het volledige reproductiepakket (https://doi.org/10.5281/zenodo.18526286) bieden wij twee reproduceerbare toegangspunten per gebruiksscenario: • P1 (hoofdtekst) full_fit_runpack: reproduceert de RC-only / closure / joint analyses en robuustheidsscans voor EFT versus DM_RAZOR, en genereert hoofdtekst-assets waaronder tabellen S1a/S1b en figuren S3/S4; • P1A (Appendix B) full_fit_runpack: reproduceert de standaardisatiestresstest van de DM-basislijn (SCAT/AC/FB + hiërarchische c–M-scatterprior + core1p + lensing m + DM_STD, inclusief de EFT_BIN-controle), en genereert Appendix-tabel B1 en fig. B1. De aanvullende tabellen/figuren en full_fit_runpack van P1A zullen als extra bestanden onder dezelfde Concept DOI worden opgenomen om één archiefingang te behouden.
9 Dankwoord en verklaringen
9.1 Dankwoord
Wij danken de SPARC- en KiDS-1000-teams voor het beschikbaar stellen van openbare data en documentatie, en de deelnemers aan de reconstructie- en auditworkflow van dit project.
9.2 Auteursbijdragen
Guanglin Tu was verantwoordelijk voor het conceptuele voorstel, het studieontwerp, de engineeringimplementatie, datacuratie, formele analyse, implementatie en audit van de reproduceerbaarheidsworkflow, en het schrijven van het manuscript.
9.3 Financiering
Zelf gefinancierd door de auteur, Guanglin Tu (geen externe financiering / geen subsidienummer).
9.4 Tegenstrijdige belangen
De auteur, Guanglin Tu, is verbonden aan de “EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)”; er worden geen andere tegenstrijdige belangen verklaard.
9.5 AI-assistentie
OpenAI GPT-5.2 Pro en Gemini 3 Pro zijn gebruikt voor taalpolijsten, structurele redactie en organisatie van de reproduceerbaarheidsworkflow. Zij zijn niet gebruikt om data, resultaten, figuren, tabellen of code te genereren of te wijzigen, en evenmin om citaties te genereren. De auteur draagt volledige verantwoordelijkheid voor de inhoud en de citatienauwkeurigheid van het gehele manuscript.
10 Referenties
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Energiedraadtheorie. Zenodo (open science repository) DOI: https://doi.org/10.5281/zenodo.18517411
Appendix A: details over herleidbaarheid en reproduceerbaarheid
Deze appendix vat langetermijn-archiefinformatie samen voor herleidbaarheid en reproduceerbaarheid, waaronder run-tags, auditresultaten, archiefinventarissen en sleutelpunten voor verificatie, zodat lezers het werk zo nodig kunnen controleren en reproduceren.
A.1 Details over herleidbaarheid en audit
Om langetermijnherleidbaarheid te waarborgen, gebruikt dit project tijdgestempelde tags voor elke run en output, en bewaart het historische producten zonder ze te overschrijven. De kernwaarden die in dit manuscript worden geciteerd, komen uit de strikte compilatie (compile_tag=20260205_035929) en hebben de volgende consistentie-audits doorstaan:
• Alle tabellen op stageniveau dragen run_tag- en stage-tags; het strikte compilatiescript selecteert “complete and consistent” canonieke tabelbronnen uit report/tables.
• Waarden in Tab_Z1_master_summary en Tab_Z2_conclusion_highlights worden item voor item vergeleken met de geselecteerde canonieke tabellen.
• Tijdens PDF-generatie wordt een tag-audit uitgevoerd op “referenced table/figure tags” om te verzekeren dat verouderde producten niet worden vermengd.
Sleuteltags (om alle tussenproducten te lokaliseren): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
Resultaat van de consistentie-audit: Tab_AUDIT_checks_strict rapporteert pass=9, fail=0, skip=0 (zie het releasepakket voor details).
A.2 Uitvoeringsstappen voor reproduceerbaarheid en archiefinventaris
Deze studie hanteert een reproduceerbaarheidssysteem dat bestaat uit “publicatieklaar rapport + tabellen/figuren-supplement + volledig opnieuw uitvoerbaar runpakket.” Lezers kunnen rechtstreeks het Tables & Figures Supplement raadplegen om alle in het artikel geciteerde tabel-/figuur-assets te verifiëren; om numerieke waarden en de auditketen vanaf nul te reproduceren, kunnen zij de full_fit_runpack gebruiken om de data te downloaden en de volledige workflow opnieuw uit te voeren. Na voltooiing kan het ingebouwde vergelijkingsscript voor referentietabellen van het pakket worden gebruikt om consistentie van tabelwaarden te verifiëren.
A.2.1 Reproductie-quickstart (RUN_FULL, Windows PowerShell)
Deze paragraaf geeft een kortere reproductieroute (Windows PowerShell). Voor snelle controles wordt lezers aangeraden rechtstreeks het Tables & Figures Supplement te raadplegen en de geciteerde tabellen en figuren item voor item te verifiëren. Voor end-to-end reproductie en generatie van alle tabellen, figuren en auditproducten gebruikt men de full_fit_runpack: volg de README/ONE_PAGE_REPRO_CHECKLIST van het pakket om verify_checksums.ps1 en RUN_FULL.ps1 uit te voeren (Mode=full aanbevolen).
Zenodo-archiefingang (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Hoofdketen-tags voor dit artikel: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.
A.2.2 Archiefmaterialen en sleutelpunten voor verificatie (pakketten & controles)
Het Zenodo-archief biedt drie complementaire categorieën materiaal: (1) publicatieklaar rapport (dit artikel, v1.1; inclusief Appendix B: P1A-standaardisatiestresstest van de DM-basislijn); (2) Tables & Figures Supplement (aanvullende tabellen en figuren die alle in dit artikel geciteerde tabel-/figuur-assets omvatten, afzonderlijk corresponderend met P1 en P1A); en (3) full_fit_runpack (volledig reproductiepakket: downloadt data vanaf nul en voert de volledige workflow opnieuw uit, afzonderlijk corresponderend met P1 en P1A). Onderdelen (1)–(2) ondersteunen snelle lezing en onafhankelijke verificatie; onderdeel (3) biedt end-to-end volledige reproduceerbaarheid.
Materiaalkategorie | Bestandsnaam (voorbeeld) | Doel en positionering (aanbevolen gebruiksvolgorde) |
Publicatieklaar rapport (Chinees en Engels) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Volledig rapport gearchiveerd op Zenodo; de hoofdtekst geeft de kernconclusies en robuustheidsaudits, en Appendix B geeft P1A (standaardisatiestresstest van de DM-basislijn). |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Alle tabellen (CSV) en figuren (PNG) die in de hoofdtekst worden geciteerd, inclusief generatiescripts en tagbestanden. |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | Alle tabellen en figuren die in Appendix B (P1A) worden geciteerd, inclusief Tab_S1_P1A_scoreboard en Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | End-to-end volledige reproductie: downloadt de data vanaf nul en voert RC-only/closure/joint en robuustheidsscans opnieuw uit. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | End-to-end volledige reproductie (Appendix B): voert DM 7+1 + DM_STD opnieuw uit (inclusief de EFT_BIN-controle) en genereert appendix-assets; het pakket bevat een vergelijkingsscript voor referentietabellen om consistentie van tabelwaarden te verifiëren. |
Citatiesuggestie: citeer bij verwijzing naar dit artikel of het bijbehorende reproduceerbaarheidsmateriaal de Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Sleutelproducten die na reproductie moeten verschijnen en vergelijkbaar moeten zijn, omvatten:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (sluitingssamenvatting)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (samenvatting gezamenlijke fit)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (σ_int-scan)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (R_min-scan)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (cov-shrink-scan)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablatie)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (negatieve controle)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (strikte mastertabel; correspondeert met tabellen S1a/S1b en waarden in de hoofdtekst)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (publicatieklare PDF-bundel; bruikbaar voor snelle raadpleging en citatie)
Appendix B: P1A—standaardisatiestresstest van de DM-basislijn (DM 7+1 + DM_STD; met EFT-controle)
Deze appendix documenteert een uitbreidingsproject (P1A) voor “standaardisatiestresstests van de DM-basislijn” dat consistent is met het sluitingsprotocol in de hoofdtekst. De rol ervan is om de minimale DM_RAZOR-basislijn die in de hoofdtekst wordt gebruikt (NFW + vaste c–M, geen scatter / geen contractie / geen core) op te waarderen tot een DM-basislijnset die dichter bij de astrofysische praktijk ligt en beter bestand is tegen gangbare kritiek, zonder een groot aantal vrijheidsgraden te introduceren en zonder de gedeelde RC-bin→GGL-bin-mapping of het auditkader te wijzigen. P1A omvat, en is een superset van, de eerdere drievoudige stresstest: het behoudt SCAT/AC/FB en voegt hiërarchische c–M-scatter + prior, een één-parameter core-proxy en een lensing-side shear-calibratie-nuisance m toe; ook levert het het gecombineerde model DM_STD. EFT_BIN blijft behouden als controlereferentie.
Aanvullende opmerking: sluitingssterktes en verwante waarden in Appendix B (P1A) gebruiken een groter Monte-Carlo-budget (bijvoorbeeld ndraw=400, nperm=24) dan het quick-budget dat in de hoofdtekst is gebruikt om de volledige EFT-kernelfamilie te dekken (bijvoorbeeld ndraw=60, nperm=12). Absolute waarden kunnen daarom samplingdrift op O(10)-niveau vertonen. Model-tot-modelvergelijkingen binnen hetzelfde budget/dezelfde tabel zijn echter eerlijk, en het teken en de schaal van het voordeel blijven stabiel over budgetten heen.
B.1 Doel en positionering (waarom P1A, en waarom als appendix)
P1A probeert niet alle mogelijke ΛCDM-halomodelleringskeuzes uit te putten (zoals niet-bolvormigheid, omgevingsafhankelijkheid, complexe galaxy–halo-connecties of hoog-dimensionale baryonfysica). In plaats daarvan volgt P1A een principe van “laag-dimensionaal, controleerbaar, reproduceerbaar”: elke uitbreidingsmodule introduceert slechts ≤1 belangrijke effectieve parameter en blijft onderworpen aan de drie harde beperkingen van dit artikel:
(i) Parameterboekhouding: elke nieuwe parameter moet expliciet worden geregistreerd en samen met informatiecriteria (AICc/BIC) worden gerapporteerd;
(ii) Gedeelde mapping: dezelfde RC-bin→GGL-bin-groeperingskaart blijft gebruikt; het afzonderlijk “tunen van de mapping” voor één dataset is niet toegestaan;
(iii) Sluitingstest: elke uitbreiding moet echte winst in RC→GGL-overdrachtsvoorspelling tonen, niet alleen een betere RC-only-fit.
B.2 DM 7+1 + DM_STD: moduledefinities, parameters en opname in de gezamenlijke posterior
Als onafhankelijke runpack biedt P1A 8 DM-werkruimten (DM 7+1) plus 1 EFT-controle: vertrekkend van DM_RAZOR als basislijn construeert het drie legacy één-parameteruitbreidingen (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), voegt het drie meer standaard verdedigingsmodules toe (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), en levert het vervolgens het gecombineerde model DM_STD. Het gedeelde doel van deze modules is de drie meest voorkomende kritieken te dekken terwijl de dimensionaliteit zo weinig mogelijk toeneemt: (a) hoe c–M-scatter en priors een hiërarchisch model binnenkomen; (b) of het hoofdeffect van baryonische feedback door een één-parameter core-proxy kan worden gevangen; en (c) of belangrijke lensing-side systematiek voor een fysisch signaal kan worden aangezien.
Werkruimte | dm_model | Nieuwe parameter(s) (≤1) | Fysische motivatie (kern) | Implementatieprincipe (auditvriendelijk) |
|---|---|---|---|---|
DM_RAZOR | NFW (vaste c–M, geen scatter) | — | Minimale, controleerbare ΛCDM-halo-basislijn; gebruikt voor strikte vergelijking met EFT | Gedeelde mapping vast; strikte parameterboekhouding; alleen gebruikt als basislijn voor relatieve vergelijking |
DM_RAZOR_SCAT | NFW + c–M-scatter (legacy) | σ_logc | De c–M-relatie heeft scatter; benaderd met één-parameter lognormale scatter | ≤1 nieuwe parameter; gedeelde mapping behouden; sluitingswinst gebruikt als acceptatiecriterium |
DM_RAZOR_AC | NFW + adiabatische contractie (legacy) | α_AC | Baryonische infall kan halo-adiabatische contractie veroorzaken; benaderd met een één-parametersterkte | ≤1 nieuwe parameter; mapping ongewijzigd; veranderingen in AICc/BIC en sluitingswinst gerapporteerd |
DM_RAZOR_FB | NFW + feedback-core (legacy) | log r_core | Feedback kan in het binnengebied een core vormen; benaderd met een één-parameter coreschaal | ≤1 nieuwe parameter; hetzelfde sluitings-/negatieve-controleprotocol; RC-only-verbetering is niet het enige doel |
DM_HIER_CMSCAT | Hiërarchische c–M-scatter + prior | σ_logc (hier) | Meer standaard hiërarchisch c_i∼logN(c(M_i),σ_logc); beïnvloedt de gezamenlijke posterior van zowel RC als GGL | Expliciete prior; latente c_i gemarginaliseerd; nog steeds laag-dimensionaal en controleerbaar |
DM_CORE1P | 1-parameter core-proxy (coreNFW/DC14-geïnspireerd) | log r_core | Gebruikt een één-parameter core-proxy voor het hoofdeffect van baryonische feedback, zonder hoog-dimensionale details van stervorming | Citeert standaardliteratuur; ≤1 nieuwe parameter; gekoppeld aan de sluitingstest |
DM_RAZOR_M | NFW + lensing shear-calibratie-nuisance | m_shear (GGL) | Absorbeert een belangrijke weak-lensing-systematiek als effectieve parameter, waardoor het risico afneemt dat systematiek voor fysica wordt aangezien | Nuisance expliciet geregistreerd; kan RC niet terugwaarts beïnvloeden; resultaten vooral beoordeeld op sluitingsrobuustheid |
DM_STD | Gestandaardiseerde DM-basislijn (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Omvat de drie meest voorkomende kritiekklassen in een nog steeds laag-dimensionale standaardbasislijn | Parameterboekhouding + informatiecriteria gerapporteerd; sluiting is de primaire indicator; gebruikt als sterkste defensieve DM-controle |
Opmerking: de bovenstaande parameternamen volgen de engineeringimplementatie (bijvoorbeeld σ_logc, α_AC, log r_core en m_shear). De ontwerpfocus van P1A is “de DM-basislijn enigszins sterker maken terwijl zij controleerbaar blijft”, niet om de DM-kant te veranderen in een onbeheersbare hoog-dimensionale fitter. In het bijzonder introduceert DM_HIER_CMSCAT c–M-scatter hiërarchisch: de concentratie c_i van elke halo krijgt een lognormale scatter rond c(M_i), begrensd door de globale σ_logc en de c(M)-prior; deze hiërarchische structuur beïnvloedt de gezamenlijke posterior van zowel RC als GGL.
B.3 Statistisch protocol en productconventies consistent met de hoofdtekst
P1A hergebruikt alle dataproducten, de gedeelde mapping en het auditkader uit de hoofdtekst. De uitvoeringsvolgorde en productconventies blijven consistent:
(1) Run‑1: RC-only-inferentie (outputs posterior_samples.npz en metrics.json);
(2) Run‑2: RC→GGL-sluitingstest (outputs closure_summary.json en de gepermuteerde basislijn);
(3) Run‑3: gezamenlijke RC+GGL-fit (outputs joint_summary.json).
Alle geciteerde getallen komen uit de automatisch samengestelde tabel (Tab_S1_P1A_scoreboard) en kunnen na het opnieuw uitvoeren van de volledige P1A-workflow worden gecontroleerd met het vergelijkingsscript voor referentietabellen dat in de P1A full_fit_runpack is ingebouwd.
B.4 Hoofdresultaten, tabel-/figuurtoegangspunten en archiefplan (zelfde DOI)
Deze paragraaf geeft de centrale kwantitatieve conclusies van P1A. Tabel B1 vat kernindicatoren samen voor RC-only, RC→GGL-sluiting en gezamenlijke RC+GGL-fit (haakjes geven verschillen ten opzichte van de DM_RAZOR-basislijn). Sluitingssterkte wordt gedefinieerd als ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (hoger is beter). Fig. B1 visualiseert hetzelfde scorebord. De hoofdpunten zijn:
• Van de drie legacy-takken geeft alleen DM_RAZOR_FB (feedback/core) een kleine nettoverbetering in sluitingssterkte: 122.21→129.45 (+7.25); SCAT en AC leveren geen nettoverbetering;
• De nieuw toegevoegde DM_HIER_CMSCAT en DM_RAZOR_M hebben zeer kleine effecten (~0) op sluitingssterkte, en DM_CORE1P toont evenmin een significante nettoverbetering;
• Het gecombineerde model DM_STD kan de gezamenlijke logL aanzienlijk verbeteren (dichter bij het optimum van de gezamenlijke fit), maar de sluitingssterkte neemt af, wat suggereert dat de winst vooral uit flexibiliteit in de gezamenlijke fit komt en niet uit overdraagbaarheid tussen sondes;
• Als controle behoudt EFT_BIN nog steeds een duidelijk voordeel in zowel sluitingssterkte als gezamenlijke fit. De hoofdconclusie is daarom robuust tegen de introductie van een “sterkere DM-basislijn + lensing-nuisance.”
Voor directe vergelijking met de resultaten in de hoofdtekst vatten tabellen S1a–S1b de strikte vergelijking tussen de EFT-familie en DM_RAZOR samen: EFT-modellen verbeteren de gezamenlijke fit met ΔlogL_total≈1155–1337 ten opzichte van DM_RAZOR en bereiken ΔlogL_closure=172–281 in de sluitingstest. P1A creëert alleen een “hardere controle” aan de DM-kant; het doel is zorgen zoals “strawman baseline” of “systematiek-als-fysica” te verminderen, niet de hoofdvergelijking te vervangen.
Tabel B1 | P1A-scorebord (hoger is beter; haakjes geven verschillen ten opzichte van de DM_RAZOR-basislijn).
Modeltak (werkruimte) | Δk | RC-only beste logL_RC (Δ) | Sluitingssterkte ΔlogL_closure (Δ) | Gezamenlijke beste logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Fig. B1 | P1A-scorebord: sluiting en gezamenlijke ΔlogL relatief ten opzichte van de basislijn (hoger is beter).

Voorbeeldtags voor de voltooide runset die bij deze appendix hoort, zijn als volgt (gebruikt om P1A-tussenproducten en tabellen/figuren te lokaliseren):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 Aanbevolen citatie (appendix-citatienoot)
Wanneer lezers naast de hoofdconclusies van het artikel ook de “standaardisatiestresstest van de DM-basislijn” willen citeren, wordt aanbevolen de hoofdconclusie samen met de volgende noot te citeren: “Zie Appendix B (P1A) voor gestandaardiseerde stresstests van de DM-basislijn (legacy SCAT/AC/FB + hiërarchische c–M-scatterprior + core-proxy + lensing shear-calibratie-nuisance), onder hetzelfde sluitingsprotocol.”