Excel: 2 Spalten vergleichen und Werte ausgeben

linkser

Admiral
Registriert
Juli 2002
Beiträge
8.559
Sorry fuer die miese Ueberschrift...

Fuer mein Problem habe ich eine xls gebastelt, in Wirklichkeit hab ich natuerlich ein paar mehr Zeilen (ca. 600 und ca. 10000). Vorneweg weiss ich, dass das Problem prinzipiell auch mit R zu loesen ist, aber bis ich mich da wieder reingefuchst habe, vergehen wahrscheinlich 2 Wochen...

Mir gehts darum, mir aus einem grossen Datensatz A nur die Werte rausholen zu koennen, die auch in Datensatz B enthalten sind. Und zwar zugeordnet zu Datensatz B. Ich hab natuerlich auch Werte fuer Datensatz B, aber die spielen ja hier erstmal keine Rolle.


Fuer diejenigen die es interessiert: Datensatz A sind ca. 15.000 Gene mit ihrem jeweiligen Expressionswert (Werte A) aus einem RNA-seq Experiment und ich brauch jetzt nur die Werte fuer die Gene, die ich auch in meinem Microarray habe (Datensatz B).

Ich hoffe es ist halbwegs verstaendlich. Ich vermute, dass ich mit SVERWEIS und ZAEHLENWENN arbeiten muss, hab aber keine Ahnung wie ich das zusammenbringen soll.

Vielen Dank!!!
 

Anhänge

Hallo,

ich löse sowas immer mit Index. SVERWEIS ginge auch...

Kommt der Eintrag in Datensatz A nur einmal vor? Wenn nicht, würde ich Summewenn verwenden.
 

Anhänge

Jeder Eintrag kommt nur einmal vor im Datensatz A, es kann maximal sein, dass es einen Eintrag in A nicht gibt, den es aber in B gibt. Das sollte eigentlich nicht sein, kann aber vorkommen, wenn die Benennung leicht unterschiedlich ist.

Ich hoffe, dass das nicht allzuoft auftaucht, wenn muss ich mir die Faelle dann aber eh manuell ansehen und entscheiden, ob nur eine leicht unterschiedl. Benennung vorhanden ist, oder ich den Wert einfach =0 setzen kann.

Vielen Dank schonmal! Ich werd berichten, ob es auch auf den grossen Datensatz angewendet funktioniert :)
 
Wenn der Wert nicht vorkommt, würde die Formel "#NV" ausgeben.
Das kannst du verhindern, mit "WENNFEHLER".

In folgendem Beispiel, würde bei einem Fehler die Zahl "0" ausgegeben werden:
=WENNFEHLER(INDEX(F:F;VERGLEICH(A2;E:E;0));0)

"INDEX" nehme ich gerne, da ich dort die ganze Spalte auswählen kann. Bei "SVERWEIS" nimmt man ja in der Regel einen Bereich.
Ob es für deine Datensätze geht, musst du probieren. Ich arbeite mit vielen Zeitreihen (96 Viertelstunden * Tage * Jahre) und da klappt es selbst bei 100.000 Einträgen.
 
Zuletzt bearbeitet von einem Moderator:
Ich hab ganz vergessen, hier nochmal Rueckmeldung zu geben.

Also die Funktion an sich hat gut funktioniert, auch mit dem deutlich groesseren Datensatz. Wurde dann schlussendlich aber doch muehsam, weil es dann doch 2-3 doppelte Eintraege in Datensatz A gab. Ich hab dann manuell den biologisch weniger "sinnvolleren" gekickt, aber dadurch wurde ich dazu genoetigt, nochmal ueber alle drueber zu gehen als Kontrolle. Aber wozu ist man billiger Doktorand :cool_alt::freaky:
 
Zurück
Oben