Update README.md
Browse files
README.md
CHANGED
@@ -254,6 +254,52 @@ Even with the really well speed optimised [granite-embedding-107m-multilingual](
|
|
254 |
|
255 |
_(have to be checked twice - looks like almost everyone has a glitch in the results … the results are better with a first reduction from 2048 down to 1024 dimensions? That's the 2nd thing for the week-end.)_
|
256 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
257 |
### Training Hyperparameters
|
258 |
#### Non-Default Hyperparameters
|
259 |
|
|
|
254 |
|
255 |
_(have to be checked twice - looks like almost everyone has a glitch in the results … the results are better with a first reduction from 2048 down to 1024 dimensions? That's the 2nd thing for the week-end.)_
|
256 |
|
257 |
+
### Training Datasets
|
258 |
+
<details><summary>mmarco_3hn</summary>
|
259 |
+
|
260 |
+
#### mmarco_3hn
|
261 |
+
|
262 |
+
* Dataset: mmarco_3hn
|
263 |
+
* Size: 254,695 training samples
|
264 |
+
* Columns: <code>query</code>, <code>positive</code>, <code>negative_1</code>, <code>negative_2</code>, and <code>negative_3</code>
|
265 |
+
* Approximate statistics based on the first 1000 samples:
|
266 |
+
| | query | positive | negative_1 | negative_2 | negative_3 |
|
267 |
+
|:--------|:------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------|
|
268 |
+
| type | string | string | string | string | string |
|
269 |
+
| details | <ul><li>min: 10 characters</li><li>mean: 39.21 characters</li><li>max: 152 characters</li></ul> | <ul><li>min: 64 characters</li><li>mean: 401.22 characters</li><li>max: 1002 characters</li></ul> | <ul><li>min: 89 characters</li><li>mean: 395.82 characters</li><li>max: 1134 characters</li></ul> | <ul><li>min: 60 characters</li><li>mean: 411.34 characters</li><li>max: 1324 characters</li></ul> | <ul><li>min: 21 characters</li><li>mean: 400.71 characters</li><li>max: 952 characters</li></ul> |
|
270 |
+
* Samples:
|
271 |
+
| query | positive | negative_1 | negative_2 | negative_3 |
|
272 |
+
|:--------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
273 |
+
| <code>herz wofür steht scd</code> | <code>SCD. 1. Sichelzellenanämie, siehe dort. 2. Subakute kombinierte Degeneration, siehe dort. 3. Plötzlicher Herztod, siehe dort. SCD. Abkürzung für Sequential Compression Device. ScD. Abkürzung für Doktor der Wissenschaften.</code> | <code>Ein schneller oder schneller Herzschlag ist, wenn Ihr Herz schneller als normal schlägt. Eine normale Herzfrequenz beträgt 60 bis 100 Schläge pro Minute. Als Tachykardie gilt eine Herzfrequenz von mehr als 100 Schlägen pro Minute. Wenn Sie Sport treiben oder irgendeine Art von Aktivität ausführen, schlägt Ihr Herz normalerweise schneller.</code> | <code>Skelettmuskeln (freiwillig) und glatte (unfreiwillige) Muskeln finden sich in einem Hühnerflügel. Der Herzmuskel wird in einem Hühnerflügel nicht gefunden, weil der Herzmuskel im Herzen gefunden wird. 2 Personen fanden dies nützlich.</code> | <code>Eine isolierte Herzmuskelzelle schlägt. Der Herzmuskel (Herzmuskel) ist ein unwillkürlich quergestreifter Muskel, der sich in den Wänden und der histologischen Grundlage des Herzens befindet, insbesondere im Myokard. Der Herzmuskel ist einer von drei Hauptmuskeltypen, die anderen sind Skelett- und glatte Muskulatur Muskeln bilden sich alle im Prozess der Myogenese. Der Herzmuskel ist einer von drei Haupttypen von Muskeln, die anderen sind die Skelettmuskulatur und die glatte Muskulatur. Diese drei Muskeltypen bilden sich alle im Prozess der Myogenese.</code> |
|
274 |
+
| <code>Welche Mondphasen erzeugen die höchsten und niedrigsten Gezeiten auf der Erde?</code> | <code>Ebbe und Flut treten jeweils zweimal an einem 24-Stunden-Tag auf, aber da der Mond jeden Tag 50 Minuten später aufgeht, unterscheiden sich die Gezeitenzyklen täglich um die gleichen 50 Minuten. Springfluten. Auch die Mondphasen beeinflussen die Gezeiten. Wenn der Mond seine Voll- oder Neumondphase erreicht, ist die Flut am höchsten, während die Ebbe niedriger als gewöhnlich ist. Springfluten genannt, treten diese Gezeiten auf, wenn Sonne, Mond und Erde alle auf einer Linie stehen. Die zusätzliche Schwerkraft der Sonne kann dazu führen, dass sich die Ozeane stärker ausbeulen als zu anderen Zeiten. Neap Gezeiten</code> | <code>1 Immer wenn Mond, Erde und Sonne ausgerichtet sind, erhöht sich die Anziehungskraft der Sonne zu der des Mondes und verursacht maximale Gezeiten. Springfluten treten auf, wenn sich Sonne und Mond auf derselben Seite der Erde befinden (Neumond) oder wenn sich Sonne und Mond auf gegenüberliegenden Seiten der Erde befinden (Vollmond).</code> | <code>In Maine (USA) tritt Ebbe ungefähr bei Mondaufgang und Flut bei Hochmond auf, was dem einfachen Gravitationsmodell von zwei Gezeitenwölbungen entspricht; an den meisten Orten haben Mond und Gezeiten jedoch eine Phasenverschiebung. gemischte Flut; Zwei ungleichmäßige Gezeiten pro Tag oder ein Hoch- und ein Niedrigwasser sind ebenfalls möglich. Die Gezeiten variieren aufgrund einer Reihe von Faktoren auf Zeitskalen, die von Stunden bis zu Jahren reichen. Um genaue Aufzeichnungen zu machen, messen Gezeitenmesser an festen Stationen den Wasserstand im Laufe der Zeit.</code> | <code>Im Allgemeinen nennen wir die größten Landflächen der Erde die Kontinente der Erde.</code> |
|
275 |
+
| <code>Vorteile des Automechanikers</code> | <code>Der typische Mechaniker sieht sich bei der Arbeit Herausforderungen wie körperlichen Beschwerden und frustrierten Kunden gegenüber. Aber für diejenigen mit einer ausgeprägten mechanischen Begabung und einer Leidenschaft für Autos bietet der Job eine Vielzahl von Vorteilen. Gute Löhne Automechaniker haben die Möglichkeit, gute Löhne zu verdienen. Laut PayScale.com verdienen Mechaniker mit fünf bis neun Jahren Erfahrung zwischen 13,98 und 20,40 US-Dollar pro Stunde. Personen mit 20 oder mehr Jahren Erfahrung können ab 2010 zwischen 17,81 und 24,94 USD pro Stunde verdienen.</code> | <code>Bemerkenswerte gesundheitliche Vorteile durch fortschrittliche Technologie. Das Herzstück der Richway BioMat-Technologie ist eine Kombination aus Ferninfrarotstrahlen, negativen Ionen und den leitfähigen Eigenschaften von Amethystkanälen. Diese drei leistungsstarken Gesundheitsstimulatoren sind in einem einzigen, einfach zu verwendenden Produkt mit bemerkenswerten Vorteilen kombiniert.</code> | <code>Selbst ein bescheidener Gewichtsverlust kann große Vorteile bringen. Die gute Nachricht ist, dass unabhängig von Ihrem Gewichtsverlustziel selbst ein bescheidener Gewichtsverlust, z Blutzucker.2.</code> | <code>polyglanduläres Autoimmunsyndrom; PGA-Syndrom Typ 1; Autoimmun-Polyendokrinopathie Typ 1; Autoimmun-Polyendokrin-Candidiasis-Ektodermales Dystrophie-Syndrom; Unterteilungen der Unordnung. Keiner; Allgemeine Diskussion. APS-1 ist eine seltene und komplexe Erbkrankheit der Immunzelldysfunktion mit multiplen Autoimmunitäten. Es präsentiert sich als eine Konstellation von Symptomen und Nebenwirkungen mit potenziell lebensbedrohlichen endokrinen Drüsen und gastrointestinalen</code> |
|
276 |
+
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
|
277 |
+
```json
|
278 |
+
{
|
279 |
+
"loss": "MultipleNegativesRankingLoss",
|
280 |
+
"matryoshka_dims": [
|
281 |
+
2048,
|
282 |
+
1024,
|
283 |
+
512,
|
284 |
+
256,
|
285 |
+
128,
|
286 |
+
64,
|
287 |
+
32
|
288 |
+
],
|
289 |
+
"matryoshka_weights": [
|
290 |
+
1,
|
291 |
+
1,
|
292 |
+
1,
|
293 |
+
1,
|
294 |
+
1,
|
295 |
+
1,
|
296 |
+
1
|
297 |
+
],
|
298 |
+
"n_dims_per_step": -1
|
299 |
+
}
|
300 |
+
```
|
301 |
+
</details>
|
302 |
+
|
303 |
### Training Hyperparameters
|
304 |
#### Non-Default Hyperparameters
|
305 |
|