Dienst van SURF
© 2025 SURF
Machine learning models have proven to be reliable methods in classification tasks. However, little research has been done on classifying dwelling characteristics based on smart meter & weather data before. Gaining insights into dwelling characteristics can be helpful to create/improve the policies for creating new dwellings at NZEB standard. This paper compares the different machine learning algorithms and the methods used to correctly implement the models. These methods include the data pre-processing, model validation and evaluation. Smart meter data was provided by Groene Mient, which was used to train several machine learning algorithms. The models that were generated by the algorithms were compared on their performance. The results showed that Recurrent Neural Network (RNN) 2performed the best with 96% of accuracy. Cross Validation was used to validate the models, where 80% of the data was used for training purposes and 20% was used for testing purposes. Evaluation metrices were used to produce classification reports, which can indicate which of the models work the best for this specific problem. The models were programmed in Python.
De arbeidsmarkt is continu in ontwikkeling, leidend tot een steeds veranderende vraag naar competenties en banen. Dit vraagt naast beroepsgerichte vaardigheden en kennis over veerkracht en wendbaarheid van professionals. Van de student wordt daarom verwacht dat die zich ontwikkeld in zelfgereguleerd (ZGL) leren. ZGL gaat over regie van het eigen leerproces: studenten bepalen zelf hoe tot leerresultaten te komen, deze te evalueren en sturen het leerproces zelf bij. Voor opleidingen is het de vraag hoe ze ZGL kunnen begeleiden en bevorderen. Dit behoeft inzicht in leergedrag, patronen hierin en bewustzijn over hoe deze inzichten gebruikt kunnen worden om ZGL te ondersteunen en het leerproces te begeleiden. In dit onderzoek is geïnventariseerd of de data die studenten in de elektronische leeromgeving (ELO) achterlaten een indicatie kan geven over het leerproces en ZGL van de student. Om de ingewikkelde patronen uit de data te halen, zijn de data uit de ELO met behulp van AItechnieken geanalyseerd. Hiermee kon het leerproces van studenten in verschillende categorieën worden onderverdeeld. De categorieën geven een eerste indicatie over het ZGL van de student. Verder onderzoek is benodigd, ook om te onderzoeken wat dit betekent voor de ondersteuning van studenten in hun leerproces.
Machine learning models have proven to be reliable methods in classification tasks. However, little research has been conducted on the classification of dwelling characteristics based on smart meter and weather data before. Gaining insights into dwelling characteristics, which comprise of the type of heating system used, the number of inhabitants, and the number of solar panels installed, can be helpful in creating or improving the policies to create new dwellings at nearly zero-energy standard. This paper compares different supervised machine learning algorithms, namely Logistic Regression, Support Vector Machine, K-Nearest Neighbor, and Long-short term memory, and methods used to correctly implement these algorithms. These methods include data pre-processing, model validation, and evaluation. Smart meter data, which was used to train several machine learning algorithms, was provided by Groene Mient. The models that were generated by the algorithms were compared on their performance. The results showed that the Long-short term memory performed the best with 96% accuracy. Cross Validation was used to validate the models, where 80% of the data was used for training purposes and 20% was used for testing purposes. Evaluation metrics were used to produce classification reports, which indicates that the Long-short term memory outperforms the compared models on the evaluation metrics for this specific problem.
The project aim is to improve collusion resistance of real-world content delivery systems. The research will address the following topics: • Dynamic tracing. Improve the Laarhoven et al. dynamic tracing constructions [1,2] [A11,A19]. Modify the tally based decoder [A1,A3] to make use of dynamic side information. • Defense against multi-channel attacks. Colluders can easily spread the usage of their content access keys over multiple channels, thus making tracing more difficult. These attack scenarios have hardly been studied. Our aim is to reach the same level of understanding as in the single-channel case, i.e. to know the location of the saddlepoint and to derive good accusation scores. Preferably we want to tackle multi-channel dynamic tracing. • Watermarking layer. The watermarking layer (how to embed secret information into content) and the coding layer (what symbols to embed) are mostly treated independently. By using soft decoding techniques and exploiting the “nuts and bolts” of the embedding technique as an extra engineering degree of freedom, one should be able to improve collusion resistance. • Machine Learning. Finding a score function against unknown attacks is difficult. For non-binary decisions there exists no optimal procedure like Neyman-Pearson scoring. We want to investigate if machine learning can yield a reliable way to classify users as attacker or innocent. • Attacker cost/benefit analysis. For the various use cases (static versus dynamic, single-channel versus multi-channel) we will devise economic models and use these to determine the range of operational parameters where the attackers have a financial benefit. For the first three topics we have a fairly accurate idea how they can be achieved, based on work done in the CREST project, which was headed by the main applicant. Neural Networks (NNs) have enjoyed great success in recognizing patterns, particularly Convolutional NNs in image recognition. Recurrent NNs ("LSTM networks") are successfully applied in translation tasks. We plan to combine these two approaches, inspired by traditional score functions, to study whether they can lead to improved tracing. An often-overlooked reality is that large-scale piracy runs as a for-profit business. Thus countermeasures need not be perfect, as long as they increase the attack cost enough to make piracy unattractive. In the field of collusion resistance, this cost analysis has never been performed yet; even a simple model will be valuable to understand which countermeasures are effective.
Het stabiel operationeel houden van anaerobe vergisters van organische afvalstromen (bijvoorbeeld mest, voedselafval of zuiveringsslib) is een grote uitdaging. Veel vergisters draaien daardoor suboptimaal of staan zelfs helemaal stil, met economische schade voor de boer, leveranciers van biovergisters, als samenleving door minder omzetting van circulaire grondstoffen tot bijvoorbeeld vetzuren of methaan. Mechanistische modellen worden toegepast voor geautomatiseerde procesregeling, maar de onderliggende microbiële en fysisch chemische processen zijn dusdanig gecompliceerd dat de regeling weinig robuust is. Daarentegen kan kunstmatige intelligentie –en met name Artificial Neural Network (ANN)– systeemgedrag beschrijven zonder voorkennis van de in de bioreactor optredende mechanismen. ANN-modellen hebben met succes biogasproductie voorspeld en geoptimaliseerd met specifieke input- en outputparameters. Dit voorstel beoogt een Slimme Procesregeling voor Anaerobe VERgisters en geeft de aanzet tot een ANN-model dat in staat is om het vergistingsproces onder verschillende omstandigheden te voorspellen op basis van gegevens verkregen uit literatuuronderzoek en experimenten. Een vervolgproject kan dit uitbouwen naar een nauwkeuriger ANN-model dat een proactieve regelstrategie kan geven voor de vergisters in het werkveld van onder andere de projectpartners HoSt en Methaplanet. Vernieuwend is de kruisbestuiving tussen verwaarding van organische reststromen met kunstmatige intelligentie in een samenwerkingsverband tussen de Saxion-lectoraten Duurzame Energievoorziening, Ambient Intelligence, de UT-vakgroep Discrete Mathematics and Mathematical Programming, genoemde vergisterleveranciers en ToPerform. Dit moet leiden tot een betere benutting van organische reststromen door middel van vergisting. Het voorstel past daarom binnen het thema “Chemische processen en technologie”, van de GoChem-missie Duurzame Chemie. Beoogde projectresultaten zijn: 1. Een trainingsset van empirische data die procesparameters kan relateren aan procesfalen voor verschillende soorten organische reststromen; 2. Een opzet voor een ANN die met geleverde trainingsset de mogelijkheid voor een proactieve regelstrategie voor vergisters aantoont; 3. Een aanzet voor een vervolgproject om de ANN uit te werken tot een proactieve regelstrategie voor de mkb-partners in het werkveld.