tech.ml.dataset

Liking cljdoc? Tell your friends :D

Clojure only.

Column major dataset abstraction for efficiently manipulating in memory datasets.

Column major dataset abstraction for efficiently manipulating
in memory datasets.

raw docstring

->dataset^clj

(->dataset dataset)

(->dataset dataset {:keys [table-name] :or {table-name "_unnamed"} :as options})

source

->flyweight^clj

(->flyweight dataset
             &
             {:keys [column-name-seq error-on-missing-values? number->string?]
              :or {error-on-missing-values? true}})

Convert dataset to seq-of-maps dataset. Flag indicates if errors should be thrown on missing values or if nil should be inserted in the map. IF a label map is passed in then for the columns that are present in the label map a reverse mapping is done such that the flyweight maps contain the labels and not their encoded values.

Convert dataset to seq-of-maps dataset.  Flag indicates if errors should be thrown on
missing values or if nil should be inserted in the map.  IF a label map is passed in
then for the columns that are present in the label map a reverse mapping is done such
that the flyweight maps contain the labels and not their encoded values.

tech.ml.dataset

->datasetclj

->flyweightclj

->k-fold-datasetsclj

->row-majorclj

->train-test-splitclj

add-columnclj

add-or-update-columnclj

columnclj

column-label-mapclj

column-mapclj

column-namesclj

column-values->categoricalclj

columnsclj

columns-with-missing-seqclj

compute-centroid-and-global-meansclj

correlation-tableclj

dataset->stringclj

dataset-label-mapclj

dataset-nameclj

ds-column-mapclj

ds-concatclj

ds-filterclj

ds-group-byclj

ds-map-valuesclj

ds-sort-byclj

ds-take-nthclj

feature-ecountclj

from-prototypeclj

g-meansclj

has-column-label-map?clj

impute-missing-by-centroid-averagesclj

inference-target-label-inverse-mapclj

inference-target-label-mapclj

k-meansclj

labelsclj

maybe-columnclj

metadataclj

model-typeclj

new-columnclj

num-inference-classesclj

order-column-namesclj

reduce-column-namesclj

remove-columnclj

remove-columnsclj

selectclj

select-columnsclj

set-inference-targetclj

set-metadataclj

update-columnclj

update-columnsclj

x-meansclj

->dataset^clj

->flyweight^clj

->k-fold-datasets^clj

->row-major^clj

->train-test-split^clj

add-column^clj

add-or-update-column^clj

column^clj

column-label-map^clj

column-map^clj

column-names^clj

column-values->categorical^clj

columns^clj

columns-with-missing-seq^clj

compute-centroid-and-global-means^clj

correlation-table^clj

dataset->string^clj

dataset-label-map^clj

dataset-name^clj

ds-column-map^clj

ds-concat^clj

ds-filter^clj

ds-group-by^clj

ds-map-values^clj

ds-sort-by^clj

ds-take-nth^clj

feature-ecount^clj

from-prototype^clj

g-means^clj

has-column-label-map?^clj

impute-missing-by-centroid-averages^clj

inference-target-label-inverse-map^clj

inference-target-label-map^clj

k-means^clj

labels^clj

maybe-column^clj

metadata^clj

model-type^clj

new-column^clj

num-inference-classes^clj

order-column-names^clj

reduce-column-names^clj

remove-column^clj

remove-columns^clj

select^clj

select-columns^clj

set-inference-target^clj

set-metadata^clj

update-column^clj

update-columns^clj

x-means^clj