← Experiment

Energiedraadtheorie (Energy Filament Theory, EFT): kader voor gemiddelde zwaartekracht tegenover de minimale NFW-baseline voor koude donkere materie (DM)

Auteur: Guanglin Tu
E-mail: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Affiliatie: EFT-werkgroep, Shenzhen Energy Filament Science Research Co., Ltd. (China)
Versie: v1.1 | Datum: 2026-02-14

Preprint (niet peer-reviewed) | Deze versie is bedoeld voor openbare verspreiding en reproduceerbare controle; zij vertegenwoordigt niet de uiteindelijke tijdschriftversie.

Licentie: rapport (CC BY-NC-ND 4.0); volledig reproduceerbaarheidspakket (CC BY 4.0).

Publicatierapport (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Volledig reproduceerbaarheidspakket (Concept DOI): https://doi.org/10.5281/zenodo.18526286

I. Managementsamenvatting (Executive Summary)

Dit rapport is de Zenodo-gearchiveerde volledige archiefeditie op publicatieniveau. Het biedt één controleerbare keten van data, modelboekhouding, eerlijke vergelijking, sluitingstest en reproduceerbaar materiaal. Bijlage B (P1A) fungeert als robuustheidsaanvulling: daarin worden een ‘meer standaard DM-baseline + cruciale systematische lensfout’ onder druk gezet om te testen hoe gevoelig de hoofdconclusies zijn voor realistischer DM-modellering en behandeling van lenssystematiek.

Kernconclusies (vier zinnen, direct citeerbaar; zie paragraaf 2.4):

(1) Bij fits van rotatiekrommen (RC) presteert de EFT-familie in alle combinaties van kernfunctie en prior duidelijk beter dan DM_RAZOR; de typische verbetering bedraagt Δlog𝓛_RC ≈ 10^3 (zie tabel S1a).
(2) In de RC→GGL-sluitingstest levert EFT een sterkere overdraagbaarheid tussen probes: de sluitingssterkte Δlog𝓛_closure (True−Perm) ligt significant boven die van DM_RAZOR, en het verschil blijft robuust onder scans van covariance shrinkage, R_min en σ_int (zie figuur S3 en tabel S1b).
(3) In de gezamenlijke fit (RC+GGL) behoudt EFT een stabiel voordeel; onder de negatieve controle, waarbij de gedeelde mapping wordt verbroken, zakt dat voordeel in. Dit ondersteunt de interpretatie dat het ‘gemiddelde zwaartekrachteffect’ uit de gedeelde mapping komt en niet uit toevallige overfitting (zie figuur S4).
(4) Bijlage B (P1A) test de DM-zijde met meer standaard DM-baseline-modules en één cruciale lensing-nuisance, zonder het aantal dimensies sterk te verhogen; deze versterkingen nemen het sluitingsvoordeel van EFT niet weg (zie tabel B1 en figuur B1).

Beschikbaarheid van data en code: rapport Concept DOI 10.5281/zenodo.18526334; volledig reproduceerbaarheidspakket Concept DOI 10.5281/zenodo.18526286. De labels voor Bijlage B (P1A) zijn run_tag=20260213_151233, closure_tag=20260213_161731 en joint_tag=20260213_195428.

II. Samenvatting

Wij voeren een reproduceerbare kwantitatieve vergelijking uit tussen twee theoretische kaders, op dezelfde data en onder hetzelfde statistische protocol: het model voor ‘gemiddelde zwaartekrachtcorrectie’ uit de Energiefilamenttheorie (Energy Filament Theory, EFT; niet te verwarren met de gangbare afkorting Effective Field Theory) en een baseline-model met NFW-halo’s in koude donkere materie (DM_RAZOR). DM_RAZOR is bewust gekozen als een ‘minimale DM-baseline’: een NFW-halo met een vaste c–M-relatie, zonder halo-to-halo scatter, zodat de vergelijking auditbaar en herhaalbaar blijft. Tegelijk moet duidelijk zijn dat EFT in dit artikel wordt behandeld als een fenomenologische, MOND-achtige parametrisering van een Effectief veld of effectieve respons, getoetst binnen één statistisch protocol; de microfysische eerste-principesafleiding van EFT wordt hier niet gegeven.

De dataset omvat 2295 snelheidsmetingen uit SPARC-rotatiekrommen (104 sterrenstelsels, 20 RC-bins) na uniforme preprocessing en binning, plus de equivalente oppervlaktedichtheid ΔΣ(R) uit KiDS-1000 galaxy-galaxy zwakke lensing (GGL): 4 bins in sterrenmassa, met 15 R-punten per bin, dus 60 punten in totaal, geanalyseerd met de volledige covariantie.

We voeren achtereenvolgens RC-only inferentie, de RC→GGL-sluitingstest (closure), GGL-only inferentie en gezamenlijke RC+GGL-inferentie uit. Een consistentie-audit maakt alle geciteerde getallen herleidbaar. Onder een strikt parameterboek en een vaste gedeelde mapping (DM: 20 log M200_bin-parameters; EFT: 20 log V0_bin-parameters plus één globale log ℓ) presteert de EFT-familie duidelijk beter dan DM_RAZOR in de gezamenlijke fit: ΔlogL_total = 1155–1337 ten opzichte van DM_RAZOR. Belangrijker nog: de sluitingstest laat zien dat de RC-posterior niet-triviale voorspellende kracht heeft voor GGL. Voor EFT bedraagt ΔlogL_closure = 172–281, tegenover 127 voor DM_RAZOR; wanneer de RC-bin→GGL-bin-groepering willekeurig wordt geschud, zakt het sluitingssignaal naar 6–23. Dat bevestigt dat het signaal geen statistisch toeval of implementatiebias is. Bij systematische scans van σ_int, R_min en covariance shrinkage blijft het relatieve EFT-voordeel positief en qua orde stabiel. Om de veelgehoorde zorg dat de DM-baseline te zwak is of dat systematische fouten als fysica worden gelezen te adresseren, geven we in Bijlage B (P1A) een sterker maar nog steeds laag-dimensionaal en auditbaar DM-baseline-stressonderzoek, met hiërarchische c–M scatter + prior, een éénparameter-coreproxy, lensing m en het gecombineerde model DM_STD. Onder hetzelfde sluitingsprotocol nemen deze uitbreidingen het EFT-voordeel niet weg (zie tabel B1/figuur B1).

Trefwoorden: rotatiekrommen; galaxy-galaxy zwakke lensing; sluitingstest; EFT; koude donkere materie; Bayesiaanse inferentie

III. Inleiding en overzicht van de resultaten

Rotatiekrommen (RC) en galaxy-galaxy zwakke lensing (GGL) zijn twee complementaire zwaartekrachtprobes. RC begrenst de dynamische potentiaal en de radiale-versnellingsrelatie (RAR) binnen de schijf; GGL meet de geprojecteerde massaverdeling en de zwaartekrachtrespons op haloschaal. Voor elk kandidaatmodel is de kernvraag niet of het beide datasets afzonderlijk kan fitten, maar of het ze onder één cross-data mapping en één gedeelde set beperkingen consistent kan verklaren.

Daarom staat in dit artikel de ‘sluitingstest’ (closure test) centraal. Eerst gebruiken we de RC-only posterior om GGL voorwaarts te voorspellen. Daarna vergelijken we dit met een negatieve controle waarin de RC-bin→GGL-bin-mapping wordt gepermuteerd of geschud. Zo meten we de voorspellende overdraagbaarheid tussen datasets en sluiten we schijnsignalen door implementatiebias of toevallige fit uit.

Theoretische positie en reikwijdte: dit artikel probeert niet de microfysische eerste-principesafleiding of een relativistisch complete vorm van EFT te geven. In plaats daarvan behandelen we EFT als een laag-dimensionale, MOND-achtige parametrisering van een effectief veld of effectieve respons, beschreven door een kernfunctie f(x) en een globale schaal ℓ. Binnen een streng parameterboek testen we met de RC→GGL-sluitingstest de consistentie tussen datasets en de voorspellende overdraagbaarheid.

Onderzoeksprogramma en afbakening: dit artikel maakt deel uit van een lopend P-reeksprogramma voor observationele zoektochten. Op bestaande data op sterrenstelselschaal zoeken we naar twee mogelijke effectieve achtergrondbijdragen: (i) een ‘zwaartekrachtvloer’ (mean gravity floor), beschrijfbaar als een grofgeschaalde gemiddelde zwaartekrachtrespons; en (ii) een ‘ruisvloer’ (stochastic/noise floor), verbonden met fluctuaties van microprocessen. In dit artikel (P1) richten we ons uitsluitend op de eerste: zonder aan te nemen welke microfysische productiemechanismen erachter zitten, zoeken we via de RC→GGL-sluitingstest naar observationele aanwijzingen voor een gemiddelde zwaartekrachtvloer en vergelijken we die onder één controleprotocol met een auditbare DM-baseline. Als heuristisch beeld: als er kortlevende vrijheidsgraden bestaan, kunnen hun verval of annihilatie rustmassa omzetten in energie-impuls die door andere vrijheidsgraden wordt gedragen; op effectief niveau hoort daar vanzelf een splitsing in ‘gemiddelde bijdrage + fluctuatiebijdrage’ bij. Dit artikel modelleert dat microbeeld echter niet kwantitatief.

Om overinterpretatie te vermijden, gelden de volgende grenzen:
• Wat dit artikel wél doet: onder een strikt parameterboek en een gedeelde mapping meet het met een sluitingstest de voorspellende overdraagbaarheid tussen datasets, en vergelijkt het de gemiddelde zwaartekrachtrespons van EFT reproduceerbaar met een DM-baseline.
• Wat dit artikel niet doet: het bespreekt geen microfysisch productiemechanisme, abundantie, levensduur of kosmologische beperkingen; het modelleert ook geen stochastische term die bij de ‘ruisvloer’ hoort.
• Wat dit artikel niet claimt: het heeft niet als doel donkere materie te weerleggen; P1 geeft geen eindoordeel over het bestaan van een ‘vloer’, maar rapporteert fasegebonden bewijs: binnen het robuuste meetdomein van dit artikel geven de data de voorkeur aan modellen met een gemiddelde zwaartekrachtrespons.

We maken ook expliciet dat DM_RAZOR slechts een minimale, auditbare NFW-baseline vertegenwoordigt: vaste c–M, geen scatter, geen Adiabatic Contraction, geen feedback-core, geen niet-sferische termen en geen omgevingstermen. De hoofdconclusie van de tekst is dus strikt beperkt: onder deze minimale baseline en onder het strikte parameterboek plus mappingbeperkingen is EFT consistenter tussen datasets. Om de vraag te beantwoorden of een meer standaard ΛCDM-baseline en belangrijke systematische lensfouten de conclusie wezenlijk kunnen veranderen, bundelen we laag-dimensionale maar auditbare DM-versterkingen en een lensing-nuisance in Bijlage B (P1A: gestandaardiseerde DM-baseline-stresstest), met exact dezelfde gedeelde mapping en dezelfde sluitingstest als in de hoofdtekst (zie tabel B1/figuur B1).

III.I Tab S1a–S1b: samenvatting van kernindicatoren (Strict)

Tabel S1a geeft de belangrijkste vergelijkingsindicatoren voor de gezamenlijke fit (RC+GGL): logL, ΔlogL, AICc en BIC. Tabel S1b geeft de indicatoren voor de sluitingstest en de robuustheidsscans: closure, de shuffle-negatieve controle en de scanbereiken voor σ_int / R_min / cov-shrink. Alle waarden komen uit de strikte hoofd-samenvatting Tab_Z1_master_summary en zijn in het release-archief punt voor punt te herleiden.

Tabel S1a|Belangrijkste indicatoren voor de gezamenlijke fit (RC+GGL, Strict).

Model (workspace)

W-kern

k

Gezamenlijke logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabel S1b|Sluitings- en robuustheidsindicatoren (Strict).

Model (workspace)

Sluiting ΔlogL (true-perm)

ΔlogL na negatieve-controle shuffle

Bereik ΔlogL bij σ_int-scan

Bereik ΔlogL bij R_min-scan

Bereik ΔlogL bij cov-shrink-scan

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


III.II Fig S3: sluitingssterkte (RC-only → GGL-voorspelling)

De sluitingssterkte is gedefinieerd als ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: GGL wordt voorwaarts voorspeld op basis van RC-only posterior-samples en vervolgens vergeleken met de negatieve controle waarin de RC-bin→GGL-bin-mapping is gepermuteerd.

Figuur S3|Sluitingssterkte (hoger is beter): gemiddeld log-likelihoodvoordeel van de RC-only → GGL-voorspelling.


III.III Fig S4: hoofdvergelijking van de gezamenlijke fit (RC+GGL)

Het voordeel in de gezamenlijke fit is gedefinieerd als ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Bij dezelfde data, dezelfde mapping en vrijwel dezelfde parameterschaal behaalt de EFT-familie een aanzienlijk hogere gezamenlijke log-likelihood.

Figuur S4|Voordeel van de gezamenlijke fit (hoger is beter): best logL_total voor RC+GGL ten opzichte van DM_RAZOR.


III.IV Vier conclusies (direct citeerbaar)

(1) In de uniforme gezamenlijke analyse van SPARC-rotatiekrommen en KiDS-1000 zwakke lensing presteren de modellen van het EFT-kader voor gemiddelde zwaartekracht systematisch beter dan DM_RAZOR onder het strikte controleprotocol: ΔlogL_total = 1155–1337 ten opzichte van DM_RAZOR.

(2) De RC→GGL-sluitingstest toont een sterkere voorspellende consistentie voor EFT: ΔlogL_closure = 172–281, terwijl DM_RAZOR op 127 uitkomt. Na het willekeurig schudden van de RC-bin→GGL-bin-groepering zakt het sluitingssignaal naar 6–23, wat laat zien dat het signaal afhankelijk is van de juiste cross-data mapping en niet van toevallige fit.

(3) Systematische scans van σ_int, R_min en covariance shrinkage veranderen noch het teken noch de orde van grootte van ‘EFT beter dan DM_RAZOR’, wat aangeeft dat de conclusie robuust is tegen gangbare systematische verstoringen.

(4) Bijlage B (P1A) versterkt de DM-baseline onder hetzelfde sluitingsprotocol op een ‘gestandaardiseerde en auditbare’ manier: de drie éénparameterversterkingen SCAT/AC/FB blijven behouden, en er worden hiërarchische c–M scatter + prior, een éénparameter-coreproxy en een shear-calibratieparameter m aan de lensingzijde toegevoegd, plus hun combinatie DM_STD. De resultaten laten zien dat alleen de feedback/core-tak een kleine netto verbetering van de sluitingssterkte geeft (122.21→129.45, ΔΔlogL_closure≈+7.25); de overige versterkingen leveren geen significante of zelfs een negatieve bijdrage aan de sluiting. De hoofdconclusie hangt dus niet af van de aanname dat DM_RAZOR te zwak is.

IV. Gegevens en voorbewerking

Deze studie gebruikt twee soorten openbare data. Binnen de engineering-pijplijn zijn download, controle (sha256) en preprocessing uitgevoerd met traceerbare scripts. Om een eerlijke vergelijking tussen modellen te garanderen, delen alle werkruimten (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) exact dezelfde dataproducten en bin-mapping.


IV.I Rotatiecurven (RC, SPARC)

De RC-data komen uit de Rotmod_LTG-bestanden van de SPARC-database (175 rotmod-bestanden). Na preprocessing omvat de gemodelleerde steekproef 104 sterrenstelsels, in totaal 2295 datapunten (r, V_obs), verdeeld over 20 RC-bins volgens onder meer sterrenmassa. Elk datapunt bevat de straal r (kpc), de waargenomen snelheid V_obs (km/s), de fout σ_obs en de snelheidscomponenten van gas, schijf en bulge (V_gas, V_disk, V_bul).


IV.II Zwakke lenswerking (GGL, KiDS-1000 / Brouwer+2021)

Voor GGL gebruiken we de equivalente oppervlaktedichtheid ΔΣ(R) uit figuur 3 van Brouwer et al. (2021) op KiDS-1000: 4 sterrenmassa-bins met elk 15 R-punten, plus de volledige bijbehorende covariantie. In de pijplijn wordt de oorspronkelijke long-form covariantie gereconstrueerd tot een 15×15 matrix per bin; in de Stage-B-audit zijn dimensies en numerieke plausibiliteit gecontroleerd.


IV.III RC-bin → GGL-bin-mapping en totale steekproefomvang

De 4 massabins van GGL worden met een vaste mapping verbonden met de 20 RC-bins: elke GGL-bin correspondeert met 5 RC-bins, waarbij de bijdragen van RC-bins worden gemiddeld met gewichten op basis van het aantal sterrenstelsels. Deze mapping blijft in alle modellen onveranderd en vormt de centrale fairness-beperking voor de sluitingstest en de gezamenlijke fit. Het uiteindelijke totale aantal datapunten is n_total = 2355 (RC=2295, GGL=60).

V. Modellen en statistische methode


V.I Minimale wiskundige specificatie van EFT en DM (auditeerbaar/toetsbaar)

Deze paragraaf geeft de minimale wiskundige specificatie die direct met de implementatie overeenkomt.

(a) Model voor rotatiekrommen (RC)

Voor elk RC-datapunt (r, V_obs, σ_obs) gebruiken we componentsuperpositie: V_mod²(r) = V_bar²(r) + V_extra²(r). Daarbij geldt V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). In de hoofdresultaten van dit artikel nemen we Υ_d = Υ_b = 0.5, in lijn met de empirische SPARC-aanbeveling en ook om onnodige vrijheidsgraden te beperken.

(b) EFT-correctie voor gemiddelde zwaartekracht (EFT)

De extra term in EFT wordt geparametriseerd als een ‘gemiddelde snelheid in het kwadraat’: V_extra²(r) = V0_bin² · f(r/ℓ). Hier is V0_bin de amplitudeparemeter per RC-bin (20 stuks), ℓ de globale schaal (1 parameter), en f(x) een dimensieloze vormfunctie van de kern. De in dit artikel vergeleken kernvormen, zonder extra continue vrijheidsgraden, zijn:

Fysische motivatie (uitgebreid): EFT interpreteert de extra zwaartekrachtrespons op sterrenstelselschaal als een effectieve respons na grofschalige middeling van meer microfysische processen over een eindige schaal. In dit artikel leggen we geen specifiek microfysisch mechanisme vast; we gebruiken een minimale, auditbare parametrisering om onder één statistisch protocol gecontroleerd te vergelijken en te testen.

Voor intuïtie kan de extra term ook als versnelling worden geschreven: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Voor r≫ℓ gaat f→1 en V_extra→V0_bin, zodat in het buitengebied een ongeveer vlakke extra snelheidsbijdrage ontstaat. Voor r≪ℓ en f(x)≈x verschijnt een karakteristieke versnellingsschaal a0,bin≈V0_bin²/ℓ, tot een O(1)-kernfactor, wat een MOND-achtige intuïtie geeft voor de overgang tussen binnen- en buitengebied.

De discrete kernfamilie die hier wordt gebruikt (none/exponential/yukawa/powerlaw_tail) kan worden gezien als laag-dimensionale proxy’s voor verschillende beginhellingen, overgangssnelheden en lange-afstandsstaarten, bijvoorbeeld een Yukawa-achtige afscherming versus een respons met langere staart. Ze dienen voor robuustheidsstresstests, niet om de modelruimte uitputtend af te dekken. Voor zwakke lensing construeren we uit V_avg(r) een effectieve omhullende massa en dichtheid, die we projecteren tot ΔΣ(R). Deze effectieve dichtheid moet worden gelezen als een beschrijving van de lenspotentiaal onder de aannames van sferische symmetrie en zwakveld-mapping; de volledige details staan in Bijlage A.

Alle bovenstaande kernvormen voldoen voor x→∞ aan f(x)→1, dus V_extra²→V0² verzadigt. Voor x≪1 leveren zij lineaire of sublineaire groei: bijvoorbeeld exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. De kernvormen verschillen dus observeerbaar in hun beginhelling op kleine stralen, overgangssnelheid en buitenstaart; de gezamenlijke RC+GGL-fit en de sluitingstest kunnen die verschillen onderscheiden.

De EFT-voorspelling voor zwakke lensing ΔΣ(R) wordt verkregen door uit V_avg(r) de omhullende massa en dichtheid terug te rekenen en vervolgens te projecteren: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). De numerieke implementatie gebruikt een logaritmisch rooster en verfijnt adaptief bij anomalieën, zodat stabiliteit en reproduceerbaarheid behouden blijven.

(c) DM_RAZOR: NFW-baseline voor koude-donkeremateriehalo’s

Ook hier benadrukken we dat DM_RAZOR slechts een minimale, auditbare NFW-baseline vertegenwoordigt: vaste c–M, geen scatter, geen Adiabatic Contraction, geen feedback-core, geen niet-sferische termen en geen omgevingstermen. Om het risico van een strawman baseline te beperken, beweert dit artikel niet dat zulke effecten niet bestaan. Integendeel: Bijlage B (P1A) neemt ze laag-dimensionaal en auditbaar op als stresstest, waaronder een hiërarchische behandeling van c–M scatter, een coreproxy en een shear-calibratie-nuisance aan de lensingzijde.


V.II Modelboekhouding en faire vergelijking (gedeelde parameters = definitie van sluiting)

In de hoofdvergelijking is het aantal parameters: DM_RAZOR k=20; de EFT-familie k=21, waarbij de extra parameter de globale log ℓ is. Alle modellen delen dezelfde RC-data, dezelfde GGL-data en covariantie, dezelfde RC-bin→GGL-bin-mapping, dezelfde baryonische termen en dezelfde eenheidsconversies. De kernvormen (none / exponential / yukawa / powerlaw_tail) zijn discrete keuzes en voegen geen continue parameters toe; zo wordt voorkomen dat het voordeel simpelweg uit ‘één extra vrijheidsgraad’ komt.


V.III Likelihood, priors en sampler

De RC-likelihood is een diagonale Gaussische likelihood: σ_eff² = σ_obs² + σ_int². In de hoofdresultaten staat σ_int vast op 5 km/s; in Run-5 wordt σ_int gescand. Voor GGL gebruiken we per bin de volledige covariantie in een Gaussische likelihood: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Het gezamenlijke doel is logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). De priors drukken vooral fysisch toelaatbare grenzen uit, met intervallen voor log ℓ, log V0 en log M200; wanneer vrije Υ en σ_int worden aangezet, gebruiken we zwak-informatieve priors (zie de configuraties in het implementatie- en releasepakket).

De sampler is een adaptieve block-Metropolis-random-walk: bij elke stap wordt slechts een willekeurig subblok van de parameterruimte bijgewerkt om de acceptatie in hoge dimensie te verbeteren. De stapgrootte wordt licht adaptief aangepast op basis van de vensteracceptatie, met een doelacceptatie van ongeveer 0.25. De hoofdresultaten gebruiken de quick-modus (bijvoorbeeld n_steps=800) en produceren per werkruimte traces, residuen en PPC-figuren voor handmatige en scriptmatige audit.


V.IV Sluitingstest en negatieve controle (definitie)

De sluitingstest (Run-2) test, zonder GGL opnieuw te fitten, of de RC-only posterior GGL kan voorspellen. Concreet: op RC-only posterior-samples genereren we voorwaarts de ΔΣ(R) van de 4 GGL-bins en berekenen we logL_true met de volledige covariantie. Daarna wordt de groepsmapping RC-bin→GGL-bin willekeurig gepermuteerd, wat logL_perm oplevert. De sluitingssterkte is ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Daarnaast hergroepeert Run-10 de 20 RC-bins willekeurig tot 4×5 (shuffle) en berekent de sluiting opnieuw, om te testen of het signaal afhangt van de juiste mapping.

VI. Belangrijkste resultaten en interpretatie


VI.I Hoofdresultaat van de gezamenlijke fit (RC+GGL)

De best logL_total van de gezamenlijke fit en het relatieve voordeel ΔlogL_total ten opzichte van DM_RAZOR staan in tabel S1a en figuur S4. In de hoofdvergelijking behaalt EFT_BIN het grootste gezamenlijke voordeel (ΔlogL_total=1337.210), terwijl de andere EFT-kernvormen ook duidelijk voordeel houden (1154.827–1294.442). Ook volgens de informatiecriteria (AICc/BIC) presteert de EFT-familie duidelijk beter dan DM_RAZOR, zodat het voordeel niet uit een parameterbias voortkomt.

Opmerking: de grootste bijdrage aan ΔlogL_total≈1337 komt uit de RC-term; in de joint-decompositie is ΔlogL_RC≈1065, ongeveer 80%. Dit kan worden gelezen als een milde verbetering van circa Δχ²≈0.90 per datapunt over N=2295 RC-datapunten, die onder een diagonale Gaussische likelihood vanzelf optelt tot een voordeel van orde 10^3. Tegelijk leveren GGL en de sluitingstest onafhankelijke cross-datasetbeperkingen, en de rangorde blijft stabiel onder de stresstests met σ_int, R_min en cov-shrink (zie § VII en tabel S1b).


VI.II Resultaten van de sluitingstest (RC-only → GGL)

De kernmaat van de sluitingstest, ΔlogL_closure, staat in tabel S1b en figuur S3. Voor de EFT-familie ligt de sluitingssterkte tussen 171.977 en 280.513, hoger dan de 126.678 van DM_RAZOR. Dit betekent dat EFT, zonder enige extra vrijheidsgraad tussen datasets, posterior-samples uit de RC-data levert die sterker overdraagbare voorspellende kracht hebben voor de GGL-data.

De negatieve controle ondersteunt de fysische relevantie van het sluitingssignaal. Wanneer de RC-bin→GGL-bin-groepering willekeurig wordt geschud, daalt de sluitingssterkte van EFT tot 6–15, afhankelijk van de kernvorm, terwijl de baseline-sluitingssterkte 172–281 bedraagt. Deze ‘instorting van het signaal’ sluit uit dat het voordeel slechts door numerieke implementatie, eenheidsfouten of onjuiste covariantiebehandeling ontstaat.

Figuur R1|Negatieve controle: na het shuffelen van de groepen wordt het sluitingssignaal duidelijk lager (getekend op basis van de Tab_Z1-indicatoren).


VI.III Betekenis en beperkingen van de resultaten

De conclusie van deze studie is: binnen deze dataset en dit protocol presteert de gemiddelde zwaartekrachtcorrectie van EFT beter dan de geteste DM_RAZOR-baseline. Dat moet scherp worden afgebakend. De DM-zijde gebruikt alleen een minimale NFW-baseline met vaste c(M)-relatie en zonder corevorming, niet-sferische vormen, omgevingstermen of complexere galaxy-halo connection-modellen. Dit artikel beweert daarom niet dat alle DM-modelfamilies zijn uitgesloten; het biedt een reproduceerbare, op sluitingstest gerichte baselinevergelijking om te testen of RC en GGL consistent kunnen worden verklaard door dezelfde cross-data parameters en mapping.

Om deze veelvoorkomende twijfel te beantwoorden, hebben we een onafhankelijke uitbreiding P1A voltooid (zie Bijlage B). Zonder de gedeelde RC-bin→GGL-bin-mapping of het auditkader te veranderen, versterkt P1A de DM-baseline op een gestandaardiseerde en auditbare manier: naast drie legacy-éénparameterversterkingen (SCAT/AC/FB) worden toegevoegd: (i) hiërarchische c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) een éénparameter baryonic-feedback-coreproxy (DM_CORE1P), en (iii) een shear-calibratie-nuisance m aan de zwakke-lensingzijde (DM_RAZOR_M), met daarnaast het combinatiemodel DM_STD. EFT_BIN blijft als referentiecontrole behouden.

• DM_RAZOR_SCAT (c–M scatter) — introduceert de halo-to-halo spreiding σ_logc in concentratie, om te testen of een vaste c(M) de verklaringskracht van DM systematisch onderschat;
• DM_RAZOR_AC (Adiabatic Contraction) — gebruikt één parameter α_AC om continu te interpoleren tussen ‘geen contractie’ en ‘standaardcontractie’, zodat baryonisch veroorzaakte binnencontractie minimaal kan worden meegenomen;
• DM_RAZOR_FB (Feedback / core) — gebruikt een coreschaal, bijvoorbeeld log r_core, om de onderdrukking van rotatiekrommen door corevorming in het binnengebied te beschrijven, terwijl op zwakke-lensingschalen de NFW-benadering behouden blijft.

Het kwantitatieve P1A-scoreboard staat in Bijlage B, Tabel B1 / Figuur B1, automatisch gegenereerd uit Tab_S1_P1A_scoreboard. In de sluitingsindicator levert DM_RAZOR_FB een kleine nettoverbetering (122.21→129.45, +7.25); de overige uitbreidingen dragen weinig of negatief bij aan de sluitingssterkte. Aan de kant van de gezamenlijke fit verbeteren hiërarchische c–M scatter prior (DM_HIER_CMSCAT) en het combinatiemodel (DM_STD) de joint logL aanzienlijk, maar ze verhogen de sluitingssterkte niet. Dat wijst erop dat zij vooral de flexibiliteit van de gezamenlijke fit vergroten, niet de overdraagbaarheid tussen sondes. De kernconclusie van de hoofdtekst moet daarom zo worden gelezen: onder strikte gedeelde mapping en sluitingstestbeperkingen komt het cross-dataset consistentievoordeel van EFT niet voort uit de keuze voor een ‘te zwakke’ DM-basislijn. Het P1A-releasepakket bij Bijlage B (supplementaire tabellen/figuren en full_fit_runpack) wordt als extra bestand opgenomen onder dezelfde Zenodo Concept DOI als de full_fit_runpack van dit artikel: https://doi.org/10.5281/zenodo.18526286.

VII. Robuustheid en controle-experimenten


VII.I σ_int-scan (Run-5)

We voeren een systematische scan uit over de intrinsieke spreiding σ_int van RC. Voor elke waarde van σ_int herhalen we de gezamenlijke inferentie en berekenen we ΔlogL_total ten opzichte van DM_RAZOR. De minimale en maximale waarden van ΔlogL_total binnen het scanbereik staan in tabel S1b.

Figuur R2|Bereik van ΔlogL_total onder de σ_int-scan (hoger is beter).


VII.II R_min-scan (Run-6)

Om de invloed van systematische fouten in het centrale gebied te testen, zoals niet-circulaire beweging, resolutie en onvolledige baryonische modellering, passen we op RC een R_min-drempelcut toe en herhalen we de gezamenlijke inferentie. Onder deze R_min-scan blijft het voordeel van de EFT-familie positief en qua orde stabiel.

Figuur R3|Bereik van ΔlogL_total onder de R_min-scan (hoger is beter).


VII.III cov-shrink-scan (Run-7)

Om onzekerheid in de GGL-covariantie te testen, passen we per massabin shrinkage toe op de covariantiematrix: C_α=(1−α)C+α·diag(C), en scannen we α. De resultaten laten zien dat het voordeel van de EFT-familie ongevoelig is voor deze behandeling.

Figuur R4|Bereik van ΔlogL_total onder de cov-shrink-scan (hoger is beter).


VII.IV Ablatieladder (Run-8)

Binnen EFT_BIN voeren we een geneste ablatie uit: van een uiterst minimaal model zonder vrije parameters, via een model met slechts enkele vrijheidsgraden, tot de volledige 20-bin amplitude + globale schaal. AICc/BIC laat zien dat de volledige EFT_BIN-instelling data-inhoudelijk duidelijk noodzakelijk is.

Figuur R5|Ablatieladder van EFT_BIN (AICc; lager is beter).


VII.V Leave-one-bin-out (Run-9)

Verder voeren we een leave-one-bin-out-toets (LOO) uit: van de 4 GGL-massabins wordt telkens 1 bin achtergehouden, waarna de inferentie opnieuw gebeurt op de overige bins plus alle RC-data. Vervolgens evalueren we de test-log-likelihood op de achtergehouden bin. De samenvattende indicatoren staan in de aanvullende tabel Tab_R3_leave_one_bin_out (Run-9-product; het padpatroon wordt gegeven in de lijst met kernproducten in § IX.II). Zelfs in het slechtste achtergehouden geval presteert de EFT-familie duidelijk beter dan DM_RAZOR.

Figuur R6|LOO: verdeling van de log-likelihood voor de weggelaten bin (uit Run-9-producten).


VII.VI Negatieve controle: RC-bin shuffle (Run-10)

Run-10 groepeert de 20 RC-bins willekeurig opnieuw tot 4×5 en berekent, met behoud van de RC-only posterior, de sluiting opnieuw. De resultaten laten zien dat shuffle de mean logL_true en ΔlogL_closure duidelijk verlaagt ten opzichte van de oorspronkelijke mapping (zie tabel S1b en figuur R1). Dit ondersteunt verder de interpreteerbaarheid van het sluitingssignaal.

Figuur R7|Negatieve controle: shuffle-mapping verlaagt de mean logL_true van de sluiting duidelijk (uit Run-10-producten).

VIII. Herleidbaarheid en consistentie-audit (Provenance)

Alle in dit artikel geciteerde getallen zijn punt voor punt herleidbaar in de strikt samengevatte tabellen en auditrecords van het release-archief. Om de hoofdtekst leesbaar te houden is de volledige provenance-keten, met taglijsten, audittabellen, checksumlijsten en controlewijze, verplaatst naar Bijlage A.

IX. Reproduceerbaarheid en Zenodo-archivering (Reproducibility & Archive)

Verklaring over beschikbaarheid van data en code: de SPARC-rotatiekrommen en KiDS-1000 zwakke-lensingdata die in dit artikel worden gebruikt, zijn openbare data. Het publicatierapport is gearchiveerd op https://doi.org/10.5281/zenodo.18526334; het volledige reproduceerbaarheidspakket is gearchiveerd op Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Gedetailleerde uitvoeringsstappen, afhankelijkheden, archieflijsten en hashchecks staan in Bijlage A; het ontwerp, de run-tags en outputs van de gestandaardiseerde DM-baseline-stresstest (P1A) staan in Bijlage B.

Onder dezelfde Concept DOI voor het volledige reproduceerbaarheidspakket (https://doi.org/10.5281/zenodo.18526286) bieden we twee reproduceerbare ingangen, elk met een eigen gebruiksdoel:
• P1 (hoofdtekst) full_fit_runpack: reproduceert RC-only / closure / joint en de robuustheidsscans voor EFT versus DM_RAZOR, en genereert de tabellen S1a/S1b en figuren S3/S4 uit de hoofdtekst;
• P1A (Bijlage B) full_fit_runpack: reproduceert de gestandaardiseerde DM-baseline-stresstest (SCAT/AC/FB + hiërarchische c–M scatter prior + core1p + lensing m + DM_STD, inclusief EFT_BIN-controle) en genereert tabel B1 en figuur B1 van de bijlage.
De aanvullende P1A-tabellen/figuren en de full_fit_runpack worden als extra bestanden onder dezelfde Concept DOI opgenomen, zodat er één archiefingang blijft.

X. Dankwoord en verklaringen


X.I Dankwoord

Wij danken de SPARC- en KiDS-1000-teams voor hun openbare data en documentatie; ook danken wij de deelnemers aan de reconstructie- en auditworkflow van dit project.


X.II Auteursbijdrage

Guanglin Tu was verantwoordelijk voor de conceptuele formulering, het onderzoeksontwerp, de technische implementatie, datacuratie, formele analyse, implementatie van de reproduceerbaarheidsworkflow en audit, en het schrijven van het artikel.


X.III Financiering

Persoonlijke financiering door Guanglin Tu (geen externe financiering / geen subsidienummer).


X.IV Belangenconflict

Guanglin Tu heeft een affiliatie met de EFT-werkgroep, Shenzhen Energy Filament Science Research Co., Ltd. (China); er zijn geen andere concurrerende belangen.


X.V AI-ondersteuning

OpenAI GPT-5.2 Pro en Gemini 3 Pro zijn gebruikt voor taalpolijsting, structurele redactie en ordening van de reproduceerbaarheidsworkflow. Ze zijn niet gebruikt om data, resultaten, figuren of code te genereren of te wijzigen, en ook niet om referenties te genereren. De auteur draagt de volledige verantwoordelijkheid voor de inhoud en de nauwkeurigheid van alle verwijzingen.

XI. Referenties

Bijlage A: details over herleidbaarheid en reproduceerbaarheid

Deze bijlage bundelt de informatie die nodig is voor langdurige traceerbaarheid en reproduceerbaarheid: run-tags, auditresultaten, archieflijsten en controlepunten. Zo kunnen lezers gericht controleren en, indien gewenst, reproduceren.


A.I Herleidbaarheid en auditdetails

Voor langdurige traceerbaarheid gebruikt dit project voor elke run en elk outputbestand een timestamp-tag en worden historische producten bewaard zonder overschrijven. De kernwaarden die in dit artikel worden geciteerd, komen uit de strikte samenvatting (compile_tag=20260205_035929) en zijn door de volgende consistentie-audits gegaan:

• Alle fasetabellen bevatten run_tag en fasetag; het strikte samenvattingsscript kiest uit report/tables de canonical tabellen die compleet en consistent zijn.

• De waarden in Tab_Z1_master_summary en Tab_Z2_conclusion_highlights zijn item voor item vergeleken met de gekozen canonical tabellen.

• Bij het genereren van de PDF is een labelaudit uitgevoerd op de geciteerde tabel- en figuurtags, zodat geen oude producten door elkaar worden gebruikt.

Kernlabels voor het lokaliseren van alle tussenproducten: run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Resultaat van de consistentie-audit: Tab_AUDIT_checks_strict toont pass=9, fail=0, skip=0 (zie het releasepakket).


A.II Uitvoeringsstappen voor reproduceerbaarheid en archieflijst

Deze studie gebruikt een reproduceerbaarheidsstructuur met drie lagen: publicatierapport, aanvullend materiaal met tabellen en figuren, en een volledig heruitvoerbaar runpack. Lezers kunnen de Tables & Figures Supplement direct raadplegen om alle geciteerde tabellen en figuren te controleren. Wie de waarden en auditketen vanaf nul wil reproduceren, kan de full_fit_runpack gebruiken om de data te downloaden en de volledige workflow opnieuw te draaien; na afloop kunnen de waarden met het referentietabel-controlescript in het pakket worden vergeleken.


A.II.I Reproduceerbaarheid Quickstart (RUN_FULL, Windows PowerShell)

Deze paragraaf geeft een kortere reproductieroute voor Windows PowerShell. Voor een snelle controle is het aan te raden direct de Tables & Figures Supplement te bekijken en daar de in dit artikel geciteerde tabellen en figuren stuk voor stuk te vergelijken. Voor end-to-end reproductie en het opnieuw genereren van alle tabellen, figuren en auditproducten gebruikt u de full_fit_runpack: voer volgens de README/ONE_PAGE_REPRO_CHECKLIST in het pakket verify_checksums.ps1 en RUN_FULL.ps1 uit (aanbevolen Mode=full).

Zenodo-archiefingang (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Hoofdlabels van deze studie: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.


A.II.II Archiefmaterialen en kerncontrolepunten (Packages & checks)

Het Zenodo-archief biedt drie complementaire materiaalsoorten: (1) het publicatierapport (dit artikel, v1.1, inclusief Bijlage B: P1A gestandaardiseerde DM-baseline-stresstest); (2) Tables & Figures Supplement, met aanvullende tabellen en figuren die alle in dit artikel geciteerde assets dekken, afzonderlijk voor P1 en P1A; en (3) full_fit_runpack, het volledige reproduceerbaarheidspakket dat vanaf nul data downloadt en de hele workflow opnieuw draait, afzonderlijk voor P1 en P1A. Materiaal (1)–(2) ondersteunt snel lezen en onafhankelijke controle; materiaal (3) maakt volledige end-to-end reproductie mogelijk.

Materiaalcategorie

Bestandsnaam (voorbeeld)

Gebruik en positionering (aanbevolen volgorde voor lezers)

Publicatierapport (Chinees en Engels)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Volledig Zenodo-gearchiveerd rapport; de hoofdtekst geeft hoofdconclusies en robuustheidsaudit, Bijlage B geeft P1A (gestandaardiseerde DM-baseline-stresstest).

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Alle tabellen (CSV) en figuren (PNG) die in de hoofdtekst worden geciteerd, inclusief generatiescripts en tagbestanden.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Alle tabellen en figuren die in Bijlage B (P1A) worden geciteerd, inclusief Tab_S1_P1A_scoreboard en Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

End-to-end volledige reproductie: data vanaf nul downloaden en RC-only/closure/joint plus robuustheidsscans opnieuw draaien.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

End-to-end reproductie voor Bijlage B: DM 7+1 + DM_STD (inclusief EFT_BIN-controle) opnieuw draaien en bijlage-assets genereren; bevat een referentietabel-controlescript om tabelwaarden te valideren.

Citeeradvies: vermeld bij het citeren van dit artikel of de bijbehorende reproduceerbaarheidsmaterialen de Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Na reproductie moeten onder meer de volgende kernproducten aanwezig zijn en vergeleken kunnen worden:

Bijlage B: P1A—gestandaardiseerde stresstest van de DM-basislijn (DM 7+1 + DM_STD; inclusief EFT-controle)

Deze bijlage documenteert een uitbreidingsproject (P1A) dat hetzelfde sluitingsprotocol gebruikt als de hoofdtekst: de gestandaardiseerde DM-baseline-stresstest. De bedoeling is om, zonder veel vrijheidsgraden toe te voegen en zonder de gedeelde RC-bin→GGL-bin-mapping of het auditkader te wijzigen, de minimale DM_RAZOR uit de hoofdtekst (NFW + vaste c–M, geen scatter/contractie/core) op te waarderen tot een baselinecollectie die dichter bij astrofysische praktijk staat en beter bestand is tegen gangbare kritiek. P1A omvat en overtreft de eerdere drie-tak-stresstest: SCAT/AC/FB blijven behouden, en hiërarchische c–M scatter + prior, een éénparameter-coreproxy en een shear-calibratie-nuisance m aan de lensingzijde worden toegevoegd, plus het combinatiemodel DM_STD. EFT_BIN blijft als controlereferentie behouden.

Aanvullende opmerking: de sluitingssterkte en andere waarden in Bijlage B (P1A) gebruiken een hoger Monte Carlo-budget, bijvoorbeeld ndraw=400 en nperm=24, dan de quick-budgetten in de hoofdtekst die de volledige EFT-kernfamilie afdekken, bijvoorbeeld ndraw=60 en nperm=12. Daardoor kunnen absolute waarden met orde O(10) door sampling drift verschillen. Vergelijkingen tussen modellen binnen dezelfde tabel en hetzelfde budget blijven echter eerlijk, en het teken en de orde van grootte van het voordeel blijven onder verschillende budgetten stabiel.


B.I Doel en positionering (Why P1A, and why as an Appendix)

P1A probeert niet alle mogelijke ΛCDM-halomodellering uit te putten, zoals niet-sferische vormen, omgevingsafhankelijkheid, complexe galaxy-halo connection of hoge-dimensionale baryon physics. In plaats daarvan volgt P1A het principe ‘laag-dimensionaal, auditbaar en reproduceerbaar’: elke versterkingsmodule voegt hoogstens één cruciale effectieve parameter toe en blijft onder drie harde beperkingen van dit artikel:
(i) parameterboekhouding: elke nieuwe parameter moet expliciet worden geboekt en samen met informatiecriteria (AICc/BIC) worden gerapporteerd;
(ii) gedeelde mapping: dezelfde RC-bin→GGL-bin-groepering blijft gelden; het is niet toegestaan de mapping afzonderlijk voor één dataset te tunen;
(iii) sluitingstest: elke versterking moet echte winst laten zien in RC→GGL-overdrachtsvoorspelling, niet alleen een betere RC-only fit.


B.II DM 7+1 + DM_STD: moduledefinities, parameters en toegang tot de gezamenlijke posterior

P1A biedt als onafhankelijk runpack 8 DM-werkruimten (DM 7+1) en 1 EFT-controle. Uitgaande van DM_RAZOR als baseline worden drie legacy-éénparameterversterkingen geconstrueerd (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), plus drie nieuwere defensieve modules die dichter bij standaardpraktijk liggen (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), en ten slotte het combinatiemodel DM_STD. Het gezamenlijke doel van deze modules is om met zo min mogelijk extra dimensies de drie meest voorkomende kritieken te dekken: (a) hoe c–M scatter en prior in een hiërarchisch model binnenkomen; (b) of het hoofdeffect van baryonic feedback door een éénparameter-coreproxy kan worden benaderd; en (c) of cruciale systematische fouten aan de lensingzijde mogelijk als fysisch signaal worden gelezen.

Workspace

dm_model

Nieuwe parameter (≤1)

Fysische motivatie (kern)

Implementatieprincipe (auditvriendelijk)

DM_RAZOR

NFW (fixed c–M, no scatter)

Minimale, auditbare ΛCDM-halobaseline; gebruikt voor strikte vergelijking met EFT

Vaste gedeelde mapping; strikt parameterboek; baseline alleen voor relatieve vergelijking

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

Er bestaat spreiding in de c–M-relatie; benaderd met één lognormale scatterparameter

≤1 nieuwe parameter; gedeelde mapping blijft; sluitingswinst is de acceptatiemaat

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Baryonische infall kan halocontractie veroorzaken; één parameter benadert de sterkte

≤1 nieuwe parameter; mapping blijft; AICc/BIC-verandering en sluitingswinst worden gerapporteerd

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback kan in het binnengebied een core vormen; één coreschaal benadert dat effect

≤1 nieuwe parameter; sluiting/negatieve controle met dezelfde definitie; RC-only verbetering is niet het enige doel

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Meer standaard hiërarchische c_i∼logN(c(M_i),σ_logc); beïnvloedt tegelijk de gezamenlijke posterior van RC en GGL

Expliciete prior; marginalisatie over latente c_i; blijft laag-dimensionaal en auditbaar

DM_CORE1P

1-parameter core proxy (coreNFW/DC14-inspired)

log r_core

Een éénparameter-coreproxy vangt het hoofdeffect van baryonic feedback zonder hoge-dimensionale stervormingsdetails

Standaardliteratuur geciteerd; ≤1 nieuwe parameter; gekoppeld aan de sluitingstest

DM_RAZOR_M

NFW + lensing shear-calibration nuisance

m_shear (GGL)

Een cruciale systematische fout aan de zwakke-lensingzijde wordt als effectieve parameter opgenomen, zodat het risico daalt dat systematiek als fysica wordt gelezen

Nuisance wordt expliciet geboekt; mag RC niet terug beïnvloeden; beoordeling primair op robuuste sluiting

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Brengt de drie meest voorkomende kritiekpunten samen in één nog steeds laag-dimensionale standaardbaseline

Parameterboek + informatiecriteria samen gerapporteerd; sluiting is hoofdindicator; sterkste defensieve DM-controle

Toelichting: de parameterbenamingen volgen de technische implementatie, bijvoorbeeld σ_logc, α_AC, log r_core en m_shear. Het ontwerpdoel van P1A is ‘de DM-baseline sterker maken maar auditbaar houden’, niet de DM-zijde veranderen in een onbeheersbare hoog-dimensionale fitter. In het bijzonder introduceert DM_HIER_CMSCAT c–M scatter hiërarchisch: voor elke halo krijgt de concentratie c_i een lognormale spreiding rond c(M_i), met een globale σ_logc en een c(M)-prior die deze structuur begrenzen. Die hiërarchische structuur beïnvloedt tegelijk de gezamenlijke posterior van RC en GGL.


B.III Statistisch protocol en productdefinitie consistent met de hoofdtekst

P1A hergebruikt alle dataproducten, de gedeelde mapping en het auditkader van de hoofdtekst. De uitvoeringsvolgorde en productdefinities blijven gelijk:
(1) Run-1: RC-only inferentie (output posterior_samples.npz en metrics.json);
(2) Run-2: RC→GGL-sluitingstest (output closure_summary.json en permuted baseline);
(3) Run-3: gezamenlijke RC+GGL-fit (output joint_summary.json).
Alle geciteerde cijfers komen uit de automatisch samengestelde tabel Tab_S1_P1A_scoreboard en kunnen na een volledige heruitvoering met de P1A full_fit_runpack worden gecontroleerd via het ingebouwde referentietabel-script.


B.IV Hoofdresultaten, tabel-/figuuringang en archiveringsplan (zelfde DOI)

Deze paragraaf geeft de kernconclusies van P1A. Tabel B1 vat de belangrijkste indicatoren samen voor RC-only, de RC→GGL-sluitingstest en de gezamenlijke RC+GGL-fit, met tussen haakjes de verschillen ten opzichte van de DM_RAZOR-baseline. De sluitingssterkte is ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩; hoger is beter. Figuur B1 visualiseert dezelfde scoreboard. De hoofdpunten zijn:
• Van de drie legacy-takken levert alleen DM_RAZOR_FB (feedback/core) een kleine netto verbetering van de sluitingssterkte: 122.21→129.45 (+7.25); SCAT en AC leveren geen netto winst;
• De nieuwe DM_HIER_CMSCAT en DM_RAZOR_M hebben een zeer klein effect op de sluitingssterkte (~0), en DM_CORE1P toont evenmin significante netto verbetering;
• Het combinatiemodel DM_STD kan de joint logL duidelijk verbeteren en dichter bij de gezamenlijke-fit-optimum komen, maar de sluitingssterkte daalt juist. Dat wijst erop dat de winst vooral uit fitflexibiliteit komt, niet uit overdraagbaarheid tussen probes;
• EFT_BIN blijft als controle duidelijk beter in sluitingssterkte en gezamenlijke fit. De hoofdconclusie van de tekst blijft dus robuust tegen de invoering van een ‘sterkere DM-baseline + lensing nuisance’.

Voor een directe vergelijking met de hoofdvergelijking vatten de tabellen S1a–S1b in de hoofdtekst de strikte resultaten voor de EFT-familie en DM_RAZOR samen: de EFT-modellen verbeteren de gezamenlijke fit met ΔlogL_total≈1155–1337 ten opzichte van DM_RAZOR en behalen in de sluitingstest ΔlogL_closure=172–281. P1A maakt de DM-zijde alleen tot een moeilijkere tegenpartij; de functie ervan is om kritiek zoals strawman baseline of systematics-as-physics te verminderen, niet om de hoofdvergelijking te vervangen.

Tabel B1|P1A-scoreboard (hoger is beter; waarden tussen haakjes zijn verschillen ten opzichte van DM_RAZOR baseline).

Modeltak (workspace)

Δk

RC-only best logL_RC (Δ)

Sluitingssterkte ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Figuur B1|P1A-scoreboard: ΔlogL voor sluiting en joint fit ten opzichte van baseline (hoger is beter).

De labels van één voltooide voorbeeldrun voor deze bijlage zijn als volgt, bedoeld om P1A-tussenproducten en tabellen/figuren te lokaliseren:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.V Aanbevolen citeerwijze (Appendix citation note)

Wanneer lezers naast de hoofdconclusie ook de ‘gestandaardiseerde DM-baseline-stresstest’ willen citeren, wordt aanbevolen om bij het citeren van de hoofdconclusie ook te vermelden: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’