dacorvo HF Staff commited on Aug 28, 2025

Commit

779ec7d

verified ·

1 Parent(s): 5e828c9

Synchronizing local compiler cache.

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +344 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/Qwen/Qwen2.5-0.5B/5eef7da50a217db5b302.json +97 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/yujiepan/qwen2.5-128k-tiny-random/3292185f0123466a93a2.json +79 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/yujiepan/qwen2.5-128k-tiny-random/b60dca7d7a9c53810fe0.json +79 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/yujiepan/qwen2.5-128k-tiny-random/b9b0c081795fa9e33ca6.json +79 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/082c855afd5bbe38fea8.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/19ebb6a6a5ec909e86f1.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/1e1cab9afee16970464a.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/2420b2b633bc1e938403.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/3585a8b7eec15ef74cc9.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/4d038e1c09d623b63731.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/59c92a651b8b40190b9d.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/707d5fc3c98b3c204500.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/8829976eff976b676195.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/903f2ac3444c8203b948.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/9b69ad26e6071c069631.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/aa7706c37f42f9b0efa0.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/b5b638607d26526724c7.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/ce96b3b9bef1f6cf0d93.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/cf3a4b3035690a565ab1.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/d2da3177c42e88297899.json +55 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/e59dd1535caa6a29b4cc.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/beit/hf-internal-testing/tiny-random-BeitForImageClassification/7b8399664c54026a03ff.json +90 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/beit/hf-internal-testing/tiny-random-BeitForImageClassification/8eea34f80bdd528f4c47.json +90 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/Jingya/tiny-random-bert-remote-code/601076bf2990d898404b.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/fxmarty/tiny-bert-sst2-distilled-subfolder/d7d576d06e1491d72e5a.json +61 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/07d9dac237105afed7b4.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/0d7dca7e1b02d11fa30b.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/22ce2cce0b08d134021c.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/28bcefedc9caadd676ab.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/3908bf519c210b434176.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/5ead9d705b13f37e716b.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/80c925bab2fcc5749b91.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/92f51980d46489605055.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/aeebf3f56cf9d0ed0250.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/cfb94bae5629e275593f.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e050716b5de372871d73.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e0768f223c51e12fd868.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e2594a1f187f452902f7.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e4834fd951418b796374.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e7e71e6beffbf701391b.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/ea81a963f6aa67da9f09.json +53 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/ef32dca934503ba9400c.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/f15944a91bf873bc4059.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/sentence-transformers/all-MiniLM-L6-v2/b571d0d9ac9ad084fa8c.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/sentence-transformers/all-MiniLM-L6-v2/f99a0822ae493faf0bb5.json +54 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/16650c04744503a0af47.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/3d5fe21de242b8b602d5.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/4b4a4fbbe9d668bcf61e.json +52 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/5bca725791b646775427.json +53 -0

.gitattributes CHANGED Viewed

@@ -10270,3 +10270,347 @@ neuronxcc-2.20.9961.0+0acef03a/MODULE_057bc784fc164fb34d3e+ed72d204/model.neff f
 neuronxcc-2.20.9961.0+0acef03a/MODULE_de733c6f96020a1e5f56+a9d440f5/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.20.9961.0+0acef03a/MODULE_de733c6f96020a1e5f56+a9d440f5/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.20.9961.0+0acef03a/MODULE_e3031c3c114f7c905db7+ae6a382b/model.neff filter=lfs diff=lfs merge=lfs -text

 neuronxcc-2.20.9961.0+0acef03a/MODULE_de733c6f96020a1e5f56+a9d440f5/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.20.9961.0+0acef03a/MODULE_de733c6f96020a1e5f56+a9d440f5/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.20.9961.0+0acef03a/MODULE_e3031c3c114f7c905db7+ae6a382b/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0219e831452f3e9b80e6/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_021be40fb5716d1066d1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_02c51eae95f4097f74e7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_07d9dac237105afed7b4/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_082c855afd5bbe38fea8/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0994f3d43a554bcbbcd7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0ad6e67d0b4363af0472/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0af77bd813eb760ae10d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0b0b6686a4841c281f89/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0b384d0739d57659345e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0bfe6d17355fd2f0836f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0ca055684d61c552e3ec/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0ca23862a0ff1499156f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0d7dca7e1b02d11fa30b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0e02d4795b77fba80c35/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0f556b899de48f28b455/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_0fdfb4247e7d07ebbad0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_101f045ec3ef38dff069/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_11228616321528259762+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1179fb416e242252b8b1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_117dcaf2b5ba5b392c51/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_11d26d78110e3ea447dd/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_12273156641748218648+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1227467f6a1477aec333/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1355027528627e06e5cb/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_136344c1e04a80fc9e83/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_14069605881026998085+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_14160024224657763603+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_14829227305888857035+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_148a07ab282c4e1a2a0e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_15025462673285903344+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_15f7e443873c3474a6aa/decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_15f7e443873c3474a6aa/encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_16650c04744503a0af47/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_16839706381867715922+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_16b01b31bf5bb1c85c1d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_17327912813737302838+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_17419856824540332941+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_17641195202625304294+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_17711110885328520544+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_17855694184933887987+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_184d9b81ae20431d278e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_18d8cc6bf53b525ebb83/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_19a9557944c3c798892c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_19ebb6a6a5ec909e86f1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1ae5dec75b26da7fc293+253d6470/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1be47d7ec35995ba24e2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1ccdb35db19ea6d46330/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1d4e0541af5c102c02ad/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1e1cab9afee16970464a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1f71844521461b69a9a1/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1f71844521461b69a9a1/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1f71844521461b69a9a1/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1f71844521461b69a9a1/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_1f997b4c07c5b98b2872/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2011979c1c7685c0c1e8/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_22ac4beaed8c828e276d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_22ce2cce0b08d134021c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2420b2b633bc1e938403/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2518ad68ffda816de14c+a74130ed/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2518ad68ffda816de14c+a74130ed/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_27494e54568e0f4aef97/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_28bcefedc9caadd676ab/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2994655886375ea65794/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2bfc916223b281bde6c9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2c3447cbfc1aa2c980e4/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2d941194111edd1cc349/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2ec978f7548ba514cc92/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_2eeccd3fb290738b486c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_30709c9a1366cc22f381/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3091516cc256301854d5/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3164ef3b6e4540774d38/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3262637bc52e95809853+431f5505/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_33c68608ff1365e11b4b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_35240b83eadb946e8397/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3585a8b7eec15ef74cc9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3666724308aaa469662b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_37fb28b99dfea65dc5fd/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_38fe3c7c7cf144065eac/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3908bf519c210b434176/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_39152d050ca1aafdbcb7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3bf2eb59f27536b63a45/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3d5fe21de242b8b602d5/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_3f7a39fcaca1f42af1d6/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4067177570182b1343d2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4148dd3c4e0957c59aec/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4375062474730619889+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_44670f0e856e93e13945/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_45c7246705c9e6fab659/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_466672b98b30e850228e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_467e3986218b1c421e16/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4696932584f9d8f704d5/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4750006367237009755+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_484d55fa9705364e6d6c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_491a208ef81533ee4361/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4974b909ef52ed6985aa/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4b4a4fbbe9d668bcf61e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4b5db21c35dab98379c0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4bf35dcb438eff118841/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4d038e1c09d623b63731/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4d2fe63b7ea76c7ef876+a74130ed/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4d2fe63b7ea76c7ef876+a74130ed/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_4e4ef27b3302beb416e2+253d6470/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_50466361a10e0beb2743/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_50881c62b5e180d29b73/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_50dd1eff58edae4890c4/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_52ac96dddc861615c14b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_530b46c2c544923d9ae4/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5321652960071550735+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_54999f3651eabb911710/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_565ec63172e78bb6a459/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_566b362576597dc93bf0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_56fb08782842e65d4478/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_56fb7ca25c9741358f35/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_57575a85181cb2c0c6ce/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_59287e3a63d75be1484e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_59c92a651b8b40190b9d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5bca725791b646775427/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5cfaeab2b13c776d07bb/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5d5dadc2c2138bf8ab44/decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5d5dadc2c2138bf8ab44/encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5dba74ecad23c5836b41/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5de28d74475c2e525475/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5e0f1f4e96fb7f38115d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5ead9d705b13f37e716b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5ee5e7496586a5b158cd/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5fb0198cf9dd4a2e93ea/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_5fc297836c63bcff7ed3/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_601076bf2990d898404b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_602b46624db97cda3fee/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6081e29d0b26014e391f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_61774b9874fadd5b1723/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_61a96b508e7be967c0c7+cd3419b6/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_61a96b508e7be967c0c7+cd3419b6/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_62c0826140d6564782c3/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6356dda8884e943ca1eb/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6356dda8884e943ca1eb/text_encoder_2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6356dda8884e943ca1eb/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6356dda8884e943ca1eb/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6356dda8884e943ca1eb/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_639b34a908c080e3d3e9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_63b1a6be8b23f66fef00/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_64383c5d9ccd5d74a246/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_64a180bec331b8ec91ba/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_655beeec84479afaaafe/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_66be3aba74892f370b62/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_68d42db5e52211fa0dc3/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_68df0af504c21aa2b1ce/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6903f75a616124fbbe62/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_69748744deacc485a2da/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6a46f0468637fa1ceea4/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6b45e20838de2009119b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6cdfd3f8d054eaf72194/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6e06599623de7d47c750/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_6ec1ef9088ffe38a3d25/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_707d5fc3c98b3c204500/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_70a99404c72ad381de36/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_70ae67fe6de015024b24+cd3419b6/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_70ae67fe6de015024b24+cd3419b6/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_71d6f99f019cce5d2c56/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_7291119501971561507+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_72b1081c4393b26efe11/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_733d8ce97f615c7406f6/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_749c49190e3a9c9b1317/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_74c4ec2a3829c1027457/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_77e174f71c47d9f4d0b7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_7b1d8863929b4701df6d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_7b8399664c54026a03ff/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_7be6e0568963be54593a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_7cc364920677c1ace017/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_7dd477985731dbce8cf8/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_7ec9c0b2b3c87c96c7d0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_80563bbcc3f75213156d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_80c925bab2fcc5749b91/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_8285b8316500e52286c9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_8319eff5a8285defb5a3/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_833bce8fd7e57021a525/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_83466d3415d7c423ad3a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_83b76f3670fb9dd6d79d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_8417307499696621353+e30acd3a/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_855c66679f1728d4b0b9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_876a3fac78c9e7d8d969/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_87b36020196a848d8295/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_87eb7ec28b9b01a3f8de/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_87eb7ec28b9b01a3f8de/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_87eb7ec28b9b01a3f8de/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_87eb7ec28b9b01a3f8de/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_8829976eff976b676195/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_88abbb6c39ef61b204e1/decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_88abbb6c39ef61b204e1/encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_896e2cb6bda1ecefc195/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_89c332555d9bb1164bb3+431f5505/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_8afa7462593888c1ace0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_8b1a6646a196796c979b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_8eea34f80bdd528f4c47/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9013e8baf47aa2490da7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_903f2ac3444c8203b948/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_922088b97905a7fc46ca/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9280fd71681625e0f026/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_92b322085492cfc5743f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_92f51980d46489605055/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_93fb6328ff6b4914fec7/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_93fb6328ff6b4914fec7/text_encoder_2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_93fb6328ff6b4914fec7/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_93fb6328ff6b4914fec7/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_93fb6328ff6b4914fec7/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_950e3bf7ec0e47e9d1f6/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9584ca4279d47aa94f96/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_96263cd071abd0bb8205/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_96735d336b988c7ae46c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_96f2f0fe551f33210e73/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_98afed8f23bccfa2bf93/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_99a4d278a736dc55c4e1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_99bc626550f56c193835/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9a0e849430be2af050d7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9a67f4255c65b566abfd/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9b1e403c2901fc8169d9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9b69ad26e6071c069631/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9e7952fae90c1f6f8fb4/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9f5df17622d13f7aa0a1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_9f6a8efd40fcd1be4ca9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a1326d88e9b290f8e35a/controlnet_0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a1326d88e9b290f8e35a/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a1326d88e9b290f8e35a/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a1326d88e9b290f8e35a/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a1326d88e9b290f8e35a/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a456d73c225440c520af/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a456d73c225440c520af/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a456d73c225440c520af/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a456d73c225440c520af/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a6e434271f70307fe55a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a7dcaa4d6f7541916f6b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_aa7706c37f42f9b0efa0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ab0ec5a632242310c520/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ac82cc5cd27456228f9b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ad9de1959357baf1be93/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_aeebf3f56cf9d0ed0250/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_af36677e1d281b7581b7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b26cf211d0154814b6de/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b2a5715c8de1d06e02d1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b45d43ae8e345b80b8b6/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b46c903d70fcbd8dde04/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b571d0d9ac9ad084fa8c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b5b638607d26526724c7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b6abe5e7902b7d92c00b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b825412615cae3305380/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b83eb9efb666a7597fa6/controlnet_0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b83eb9efb666a7597fa6/controlnet_1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b83eb9efb666a7597fa6/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b83eb9efb666a7597fa6/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b83eb9efb666a7597fa6/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b83eb9efb666a7597fa6/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ba276d9e084c36d4d299/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bb5b129941b54904675f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bc33d8c25a64bc49fa25/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bc33d8c25a64bc49fa25/text_encoder_2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bc33d8c25a64bc49fa25/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bc33d8c25a64bc49fa25/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bc33d8c25a64bc49fa25/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bc7d63ab74772beafa77/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bd8a7636ac96599afce0/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bf898d9815ecfc28a3c4/decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_bf898d9815ecfc28a3c4/encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c121d453d2dce97dc9f2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c1a7e229a1e0089bc100/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c3dac669c643d4e0b641/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c6a6313df00b13f0bc20/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c76ea064827fb5ffaf3a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c7711f055c4601678bfc/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c845c7c1978a7f0fc5bc+cd3419b6/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_c845c7c1978a7f0fc5bc+cd3419b6/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_cd2b22a4d8bd6ff87e79/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ce96b3b9bef1f6cf0d93/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_cf3a4b3035690a565ab1/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_cfb94bae5629e275593f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_cfbfacea58d61c7302ac/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d0207458a6f6fb104830/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d0dd0aeeae66ba529c6f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d2c282677041876b494e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d2da3177c42e88297899/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d327dc6d21691f2390f2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d3a9e3a3693c0097041a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d4527b583703e675299f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d5fb9a76d0fdc62db217/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d5fb9a76d0fdc62db217/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d5fb9a76d0fdc62db217/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d5fb9a76d0fdc62db217/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d63d38954db56a481479/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d752631e2f1bc8b5bd5c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d780aaa6e4cc8ef4073b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d7d576d06e1491d72e5a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d83e395611ddc3a29d9f/decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_d83e395611ddc3a29d9f/encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_db7feb9a8e6a89d9b5cc/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_dbf38214a01c36374929/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_dc19e38388ce4a13824f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_dcfeb3310672a794fe59/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_dec4d4d1adf057ba26a6/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e00b8a80c7b4565a38b9/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e01d4f3ed05b3b779179/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e050716b5de372871d73/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e0768f223c51e12fd868/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e0d110db2ae6fd6f9a18/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e0e485d1effe77c0355a/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e207d10cd73986f34774/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e2594a1f187f452902f7/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e3343136a71050139f62/text_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e3343136a71050139f62/text_encoder_2/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e3343136a71050139f62/unet/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e3343136a71050139f62/vae_decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e3343136a71050139f62/vae_encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e4834fd951418b796374/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e57cbde649dde732937d/decoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e57cbde649dde732937d/encoder/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e59dd1535caa6a29b4cc/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e5c893a9ead6645e9326/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e7d6a1ed3ce052d450ca/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_e7e71e6beffbf701391b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ea65e810b73a07c4f93e/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ea81a963f6aa67da9f09/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_eaa04c5b1a458bb8ede4/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_eaffcb1bcf2a2ba5568c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ebdd3f238f484caa6f2b/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ed32d4174c8c48368338/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ef32dca934503ba9400c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f0f76b9ba98b72bdf648/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f15944a91bf873bc4059/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f1ec63e05f9ea876842c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f2764d531dd4d92fcf44/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f2fb67dde0ac51075166/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f3e9a9a693c44ea917dc/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f441d043990635e01090/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f58c375fdf2f49018e38/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f59412f8a600e9a71fb8/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f73c821d92438436ad6c/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f8697b18674e9f438a96/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f8990edfbb4deaf97027/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_f99a0822ae493faf0bb5/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_fa6da73026ca7a0eb10f/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_fba7e5f3d8634f923189/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_fd402f1583fe91543618/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_fe61ce3dd9af75901342/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ff3a95a3a80afa64563d/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_ffe8abf61d5a2a0a2b8e/model.neuron filter=lfs diff=lfs merge=lfs -text

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/Qwen/Qwen2.5-0.5B/5eef7da50a217db5b302.json ADDED Viewed

	@@ -0,0 +1,97 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "Qwen/Qwen2.5-0.5B",
+  "_task": "text-generation",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 896,
+  "initializer_range": 0.02,
+  "intermediate_size": 4864,
+  "layer_types": [
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 32768,
+  "max_window_layers": 24,
+  "model_type": "qwen2",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "async_mode": false,
+    "attn_kernel_enabled": false,
+    "batch_size": 1,
+    "capacity_factor": null,
+    "cc_pipeline_tiling_factor": 2,
+    "checkpoint_id": "Qwen/Qwen2.5-0.5B",
+    "checkpoint_revision": "060db6499f32faf8b98477b0a26969ef7d8b9987",
+    "continuous_batching": false,
+    "enable_bucketing": false,
+    "ep_degree": 1,
+    "flash_decoding_enabled": false,
+    "fused_qkv": false,
+    "glu_mlp": true,
+    "is_chunked_prefill": false,
+    "local_ranks_size": 2,
+    "logical_nc_config": 1,
+    "max_batch_size": 1,
+    "max_context_length": 128,
+    "max_topk": 256,
+    "mlp_kernel_enabled": false,
+    "mlp_kernel_fuse_residual_add": false,
+    "n_active_tokens": 128,
+    "neuronxcc_version": "2.19.8089.0+8ab9f450",
+    "num_cores_per_group": 1,
+    "on_device_sampling": true,
+    "optimum_neuron_version": "0.3.1.dev0",
+    "output_logits": false,
+    "padding_side": "right",
+    "pp_degree": 1,
+    "qk_layernorm": false,
+    "qkv_kernel_enabled": false,
+    "rpl_reduce_dtype": "bfloat16",
+    "sequence_length": 128,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": null,
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2,
+    "vocab_parallel": false
+  },
+  "num_attention_heads": 14,
+  "num_hidden_layers": 24,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 1000000.0,
+  "sliding_window": null,
+  "tie_word_embeddings": true,
+  "use_cache": true,
+  "use_mrope": false,
+  "use_sliding_window": false,
+  "vocab_size": 151936
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/yujiepan/qwen2.5-128k-tiny-random/3292185f0123466a93a2.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/qwen2.5-128k-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 8,
+  "initializer_range": 0.02,
+  "intermediate_size": 16,
+  "layer_types": [
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 32768,
+  "max_window_layers": 1,
+  "model_type": "qwen2",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "async_mode": false,
+    "attn_kernel_enabled": false,
+    "batch_size": 2,
+    "capacity_factor": null,
+    "cc_pipeline_tiling_factor": 2,
+    "checkpoint_id": "yujiepan/qwen2.5-128k-tiny-random",
+    "checkpoint_revision": "c8296d4ca3f87782876d2382fbb6481d1beb8ef0",
+    "continuous_batching": true,
+    "enable_bucketing": false,
+    "ep_degree": 1,
+    "flash_decoding_enabled": false,
+    "fused_qkv": false,
+    "glu_mlp": true,
+    "is_chunked_prefill": false,
+    "local_ranks_size": 2,
+    "logical_nc_config": 1,
+    "max_batch_size": 2,
+    "max_context_length": 100,
+    "max_topk": 256,
+    "mlp_kernel_enabled": false,
+    "mlp_kernel_fuse_residual_add": false,
+    "n_active_tokens": 100,
+    "neuronxcc_version": "2.19.8089.0+8ab9f450",
+    "num_cores_per_group": 1,
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.3.1.dev0",
+    "output_logits": false,
+    "padding_side": "right",
+    "pp_degree": 1,
+    "qk_layernorm": false,
+    "qkv_kernel_enabled": false,
+    "rpl_reduce_dtype": "float16",
+    "sequence_length": 100,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": null,
+    "torch_dtype": "float16",
+    "tp_degree": 2,
+    "vocab_parallel": false
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "factor": 4.0,
+    "original_max_position_embeddings": 32768,
+    "rope_type": "yarn",
+    "type": "yarn"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": null,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/yujiepan/qwen2.5-128k-tiny-random/b60dca7d7a9c53810fe0.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/qwen2.5-128k-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 8,
+  "initializer_range": 0.02,
+  "intermediate_size": 16,
+  "layer_types": [
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 32768,
+  "max_window_layers": 1,
+  "model_type": "qwen2",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "async_mode": false,
+    "attn_kernel_enabled": false,
+    "batch_size": 1,
+    "capacity_factor": null,
+    "cc_pipeline_tiling_factor": 2,
+    "checkpoint_id": "yujiepan/qwen2.5-128k-tiny-random",
+    "checkpoint_revision": "c8296d4ca3f87782876d2382fbb6481d1beb8ef0",
+    "continuous_batching": false,
+    "enable_bucketing": false,
+    "ep_degree": 1,
+    "flash_decoding_enabled": false,
+    "fused_qkv": false,
+    "glu_mlp": true,
+    "is_chunked_prefill": false,
+    "local_ranks_size": 2,
+    "logical_nc_config": 1,
+    "max_batch_size": 1,
+    "max_context_length": 100,
+    "max_topk": 256,
+    "mlp_kernel_enabled": false,
+    "mlp_kernel_fuse_residual_add": false,
+    "n_active_tokens": 100,
+    "neuronxcc_version": "2.19.8089.0+8ab9f450",
+    "num_cores_per_group": 1,
+    "on_device_sampling": true,
+    "optimum_neuron_version": "0.3.1.dev0",
+    "output_logits": false,
+    "padding_side": "right",
+    "pp_degree": 1,
+    "qk_layernorm": false,
+    "qkv_kernel_enabled": false,
+    "rpl_reduce_dtype": "float16",
+    "sequence_length": 100,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": null,
+    "torch_dtype": "float16",
+    "tp_degree": 2,
+    "vocab_parallel": false
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "factor": 4.0,
+    "original_max_position_embeddings": 32768,
+    "rope_type": "yarn",
+    "type": "yarn"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": null,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev0/qwen2/yujiepan/qwen2.5-128k-tiny-random/b9b0c081795fa9e33ca6.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/qwen2.5-128k-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 8,
+  "initializer_range": 0.02,
+  "intermediate_size": 16,
+  "layer_types": [
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 32768,
+  "max_window_layers": 1,
+  "model_type": "qwen2",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "async_mode": false,
+    "attn_kernel_enabled": false,
+    "batch_size": 1,
+    "capacity_factor": null,
+    "cc_pipeline_tiling_factor": 2,
+    "checkpoint_id": "yujiepan/qwen2.5-128k-tiny-random",
+    "checkpoint_revision": "c8296d4ca3f87782876d2382fbb6481d1beb8ef0",
+    "continuous_batching": false,
+    "enable_bucketing": false,
+    "ep_degree": 1,
+    "flash_decoding_enabled": false,
+    "fused_qkv": false,
+    "glu_mlp": true,
+    "is_chunked_prefill": false,
+    "local_ranks_size": 2,
+    "logical_nc_config": 1,
+    "max_batch_size": 1,
+    "max_context_length": 100,
+    "max_topk": 256,
+    "mlp_kernel_enabled": false,
+    "mlp_kernel_fuse_residual_add": false,
+    "n_active_tokens": 100,
+    "neuronxcc_version": "2.19.8089.0+8ab9f450",
+    "num_cores_per_group": 1,
+    "on_device_sampling": true,
+    "optimum_neuron_version": "0.3.1.dev0",
+    "output_logits": false,
+    "padding_side": "right",
+    "pp_degree": 1,
+    "qk_layernorm": false,
+    "qkv_kernel_enabled": false,
+    "rpl_reduce_dtype": "bfloat16",
+    "sequence_length": 100,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": null,
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2,
+    "vocab_parallel": false
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "factor": 4.0,
+    "original_max_position_embeddings": 32768,
+    "rope_type": "yarn",
+    "type": "yarn"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": null,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/082c855afd5bbe38fea8.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "fill-mask",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/19ebb6a6a5ec909e86f1.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "feature-extraction",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "last_hidden_state",
+      "pooler_output"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/1e1cab9afee16970464a.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "question-answering",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "start_logits",
+      "end_logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "question-answering",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/2420b2b633bc1e938403.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "text-classification",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/3585a8b7eec15ef74cc9.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "multiple-choice",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_num_choices": 4,
+    "static_sequence_length": 128,
+    "task": "multiple-choice",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/4d038e1c09d623b63731.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "feature-extraction",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "last_hidden_state",
+      "pooler_output"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/59c92a651b8b40190b9d.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "token-classification",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/707d5fc3c98b3c204500.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "fill-mask",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/8829976eff976b676195.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "token-classification",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/903f2ac3444c8203b948.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "fill-mask",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/9b69ad26e6071c069631.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "question-answering",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "start_logits",
+      "end_logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "question-answering",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/aa7706c37f42f9b0efa0.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "token-classification",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/b5b638607d26526724c7.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "text-classification",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/ce96b3b9bef1f6cf0d93.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "question-answering",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "start_logits",
+      "end_logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "question-answering",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/cf3a4b3035690a565ab1.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "feature-extraction",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "last_hidden_state",
+      "pooler_output"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/d2da3177c42e88297899.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "multiple-choice",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_num_choices": 4,
+    "static_sequence_length": 128,
+    "task": "multiple-choice",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/albert/hf-internal-testing/tiny-random-AlbertModel/e59dd1535caa6a29b4cc.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-AlbertModel",
+  "_task": "text-classification",
+  "architectures": [
+    "AlbertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout_prob": 0.1,
+  "embedding_size": 128,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 36,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "albert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 6,
+  "num_hidden_groups": 6,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "vocab_size": 30000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/beit/hf-internal-testing/tiny-random-BeitForImageClassification/7b8399664c54026a03ff.json ADDED Viewed

	@@ -0,0 +1,90 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BeitForImageClassification",
+  "_task": "image-classification",
+  "add_fpn": false,
+  "architectures": [
+    "BeitForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "auxiliary_channels": 256,
+  "auxiliary_concat_input": false,
+  "auxiliary_loss_weight": 0.4,
+  "auxiliary_num_convs": 1,
+  "drop_path_rate": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "image_size": 30,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "layer_scale_init_value": 0.1,
+  "model_type": "beit",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "pixel_values"
+    ],
+    "int_dtype": "int64",
+    "model_type": "beit",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_image_size": 30,
+    "static_num_channels": 3,
+    "static_patch_size": 2,
+    "task": "image-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_channels": 3,
+  "num_hidden_layers": 4,
+  "out_features": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3"
+  ],
+  "out_indices": [
+    0,
+    1,
+    2,
+    3
+  ],
+  "patch_size": 2,
+  "pool_scales": [
+    1,
+    2,
+    3,
+    6
+  ],
+  "reshape_hidden_states": true,
+  "semantic_loss_ignore_index": 255,
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "use_absolute_position_embeddings": false,
+  "use_auxiliary_head": true,
+  "use_mask_token": false,
+  "use_mean_pooling": true,
+  "use_relative_position_bias": false,
+  "use_shared_relative_position_bias": false,
+  "vocab_size": 100
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/beit/hf-internal-testing/tiny-random-BeitForImageClassification/8eea34f80bdd528f4c47.json ADDED Viewed

	@@ -0,0 +1,90 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BeitForImageClassification",
+  "_task": "image-classification",
+  "add_fpn": false,
+  "architectures": [
+    "BeitForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "auxiliary_channels": 256,
+  "auxiliary_concat_input": false,
+  "auxiliary_loss_weight": 0.4,
+  "auxiliary_num_convs": 1,
+  "drop_path_rate": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "image_size": 30,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "layer_scale_init_value": 0.1,
+  "model_type": "beit",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "pixel_values"
+    ],
+    "int_dtype": "int64",
+    "model_type": "beit",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_image_size": 30,
+    "static_num_channels": 3,
+    "static_patch_size": 2,
+    "task": "image-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_channels": 3,
+  "num_hidden_layers": 4,
+  "out_features": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3"
+  ],
+  "out_indices": [
+    0,
+    1,
+    2,
+    3
+  ],
+  "patch_size": 2,
+  "pool_scales": [
+    1,
+    2,
+    3,
+    6
+  ],
+  "reshape_hidden_states": true,
+  "semantic_loss_ignore_index": 255,
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "use_absolute_position_embeddings": false,
+  "use_auxiliary_head": true,
+  "use_mask_token": false,
+  "use_mean_pooling": true,
+  "use_relative_position_bias": false,
+  "use_shared_relative_position_bias": false,
+  "vocab_size": 100
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/Jingya/tiny-random-bert-remote-code/601076bf2990d898404b.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "Jingya/tiny-random-bert-remote-code",
+  "_task": "text-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/fxmarty/tiny-bert-sst2-distilled-subfolder/d7d576d06e1491d72e5a.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "fxmarty/tiny-bert-sst2-distilled-subfolder",
+  "_task": "text-classification",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 128,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "label2id": {
+    "negative": "0",
+    "positive": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 2,
+  "num_hidden_layers": 2,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/07d9dac237105afed7b4.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "fill-mask",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/0d7dca7e1b02d11fa30b.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "text-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/22ce2cce0b08d134021c.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "multiple-choice",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_num_choices": 4,
+    "static_sequence_length": 128,
+    "task": "multiple-choice",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/28bcefedc9caadd676ab.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "feature-extraction",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "last_hidden_state",
+      "pooler_output"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/3908bf519c210b434176.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "feature-extraction",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "last_hidden_state",
+      "pooler_output"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/5ead9d705b13f37e716b.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "text-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": false,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/80c925bab2fcc5749b91.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "question-answering",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "start_logits",
+      "end_logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "question-answering",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/92f51980d46489605055.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "text-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/aeebf3f56cf9d0ed0250.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "token-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/cfb94bae5629e275593f.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "feature-extraction",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "last_hidden_state",
+      "pooler_output"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e050716b5de372871d73.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "token-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e0768f223c51e12fd868.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "fill-mask",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e2594a1f187f452902f7.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "fill-mask",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e4834fd951418b796374.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "multiple-choice",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_num_choices": 4,
+    "static_sequence_length": 128,
+    "task": "multiple-choice",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/e7e71e6beffbf701391b.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "question-answering",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "start_logits",
+      "end_logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "question-answering",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/ea81a963f6aa67da9f09.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "question-answering",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "start_logits",
+      "end_logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "question-answering",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/ef32dca934503ba9400c.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "token-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/hf-internal-testing/tiny-random-BertModel/f15944a91bf873bc4059.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-BertModel",
+  "_task": "text-classification",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "int_dtype": "int64",
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "text-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1124
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/sentence-transformers/all-MiniLM-L6-v2/b571d0d9ac9ad084fa8c.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "sentence-transformers/all-MiniLM-L6-v2",
+  "_task": "feature-extraction",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "export_model_type": "transformer",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 384,
+  "initializer_range": 0.02,
+  "intermediate_size": 1536,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask"
+    ],
+    "int_dtype": "int64",
+    "model_type": "transformer",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "token_embeddings",
+      "sentence_embedding"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 16,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 12,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/bert/sentence-transformers/all-MiniLM-L6-v2/f99a0822ae493faf0bb5.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "sentence-transformers/all-MiniLM-L6-v2",
+  "_task": "feature-extraction",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "export_model_type": "transformer",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 384,
+  "initializer_range": 0.02,
+  "intermediate_size": 1536,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask"
+    ],
+    "int_dtype": "int64",
+    "model_type": "transformer",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "token_embeddings",
+      "sentence_embedding"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "feature-extraction",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 12,
+  "num_hidden_layers": 6,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/16650c04744503a0af47.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-camembert",
+  "_task": "token-classification",
+  "architectures": [
+    "CamembertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "camembert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask"
+    ],
+    "int_dtype": "int64",
+    "model_type": "camembert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/3d5fe21de242b8b602d5.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-camembert",
+  "_task": "fill-mask",
+  "architectures": [
+    "CamembertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "camembert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask"
+    ],
+    "int_dtype": "int64",
+    "model_type": "camembert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/4b4a4fbbe9d668bcf61e.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-camembert",
+  "_task": "token-classification",
+  "architectures": [
+    "CamembertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "camembert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": true,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask"
+    ],
+    "int_dtype": "int64",
+    "model_type": "camembert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 32,
+    "task": "token-classification",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1000
+}

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.1.dev1/camembert/hf-internal-testing/tiny-random-camembert/5bca725791b646775427.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-camembert",
+  "_task": "question-answering",
+  "architectures": [
+    "CamembertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 37,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "camembert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "float_dtype": "fp32",
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask"
+    ],
+    "int_dtype": "int64",
+    "model_type": "camembert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "start_logits",
+      "end_logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "question-answering",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 5,
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 16,
+  "use_cache": true,
+  "vocab_size": 1000
+}