Beginner Frage

Legacy User
Legacy User New Altair Community Member
edited November 5 in Community Q&A
Ich habe eine xls - Tabelle wo Zeitdaten drinnen sind (in den Spalten unterschiedliche Variablen, in den Zeilen die Werte zu verschiedenen Zeitpunkten)
Ich würde gerne eine Graphik wie folgenden erreichen.

http://de.wikipedia.org/w/index.php?title=Bild:Reg_analyse_streudiagramm.png

Zusätzlich müsste ich in den Zeitdaten ein paar Werte stopfen (sind nicht immer alle vorhanden) (linear interpolieren, bzw. den alten Wert nehmen, bzw. einen Mittelwert zwischen den alten und den neuen) .... Wichtiger ist hier aber für mich das Streudiagramm.

Welche Module brauche ich dazu?

mfg Wolfgang


Tagged:

Answers

  • steffen
    steffen New Altair Community Member
    Hallo Wolfgang

    Da RapidMiner von Leuten aus aller Welt genutzt wird, schreiben wir hier normalerweise Englisch. Da du den RapidMiner benutzt, nehme ich an, dass du dessen mächtig bist ;), um jedoch die Verwirrung zu minimieren, antworte ich auf Deutsch. In Zukunft sollten wir, damit andere noch was von der Diskussion haben, zu Englisch wechseln.

    Okay, zum Thema:
    Was du möchtest heisst im Englischen Scatterplot bzw. Scatterplot Matrix und ist im RapidMiner im Hauptprogramm enthalten. Einfach den Operator "ExcelExampleSource" unter New Operator -.> IO-> Examples auswählen, laden und dann zum Plot - Tab wechseln. Dort findest du was du suchst.

    Das RapidMiner Kern Programm hat bereits einige Verfahren zum Ersetzen von fehlenden Daten, siehe unter New Operator -> Preprocessing -> Data -> Missing...

    Desweiteren gibt es noch ein Plugin zum gezielten Verarbeiten von Zeitreihen. Das findest du hier: *Klick mich*.

    Hoffe ich konnte dir helfen

    Steffen

  • Legacy User
    Legacy User New Altair Community Member
    Thanks for your answer and as required in englisch.

    I have now the Rapidminer 4.2 + the Value Series Plugin 4.2.

    I tried out the MissingValueReplenishment but, there i can only use statistic values and not "a fill up with the last value".  How do i fill the grid with the last value?

    The next thing i tried out (after i discovered the new Preprocessing / Value Series Stuff)  i put a "preproc... . ValueSeries . Transfor...Basis. fastfouriertransformation ( after my excelexamplesoure)

    <operator name="Root" class="Process" expanded="yes">
       <operator name="ExcelExampleSource" class="ExcelExampleSource">
           <parameter key="excel_file" value="C:\trendtest.xls"/>
           <parameter key="first_row_as_names" value="true"/>
       </operator>
       <operator name="FastFourierTransform" class="FastFourierTransform">
       </operator>
    </operator>

    I got the following error: FastFourierTransform (FastFourierTransform) The operator needs some input of type com.rapidminer.valueseries.SeriesIOObject which is not prov

    I replaced the ExcelExampleSource with the SeriesExampleSetGenerator there i got the same error.


    Thanks for your help.
  • wolfgang
    wolfgang New Altair Community Member
    PS: i tried also out the scatterplot but there are no lines between the points !?
  • IngoRM
    IngoRM New Altair Community Member
    Hi Wolfgang,

    for the operators from the value series plugin you would first have to transform your data into a series object. This can be done with the following basic setup (just adapt the path to the sonar data set):

    <operator name="Root" class="Process" expanded="yes">
        <operator name="ExampleSource" class="ExampleSource">
            <parameter key="attributes" value="C:\Dokumente und Einstellungen\Mierswa\Eigene Dateien\rm_workspace\sample\data\sonar.aml"/>
            <parameter key="sample_size" value="1"/>
        </operator>
        <operator name="FeatureNameFilter" class="FeatureNameFilter">
            <parameter key="filter_special_features" value="true"/>
            <parameter key="skip_features_with_name" value="label"/>
        </operator>
        <operator name="Single2Series" class="Single2Series">
        </operator>
        <operator name="ValueSeriesPreprocessing" class="ValueSeriesPreprocessing" expanded="yes">
            <operator name="Visualizer" class="Visualizer">
            </operator>
        </operator>
    </operator>

    Maybe this helps.

    Cheers,
    Ingo