jrtechs
/
PerryXDeng-wheatyeeters
mirror of https://github.com/PerryXDeng/wheatyeeters.git

import pandas as pdimport numpy as np

def start_end_times(filename):  df = pd.read_csv(filename)  columnname = "Date"  dt = pd.to_datetime(df[columnname], format="%Y-%m-%d")  print()  print(filename)  print("min")  print(dt.min())  print("max")  print(dt.max())  return dt.min()

def timeframes():  start_end_times("data/rpe.csv")  start_end_times("data/games.csv")  start_end_times("data/wellness.csv")

def normalize_time_series(path, filename, start):  df = pd.read_csv(path)  columnname = "Date"  dt = pd.to_datetime(df[columnname], format="%Y-%m-%d")  df["TimeSinceAugFirst"] = (dt - start).dt.days  df.to_csv("cleaned/time_series_" + filename)

start = start_end_times("data/rpe.csv")normalize_time_series("cleaned/normalizedWellness.csv", "normalizedWellness.csv", start)