Conheça o blog técnico de Carlos Diego

Pesquisas em Andamento

Pesquisas atualmente em andamento, sendo conduzidas por Carlos Diego C. P., seus grupos de pesquisas e alunos dos programas de gradução e pós-graduação (Mestrado e Doutorado) em Ciências da Computação.

Data Lakes como camada de integração centralizada para ambientes empresariais distribuídos e monolíticos

Área de Estudo

Objetivo da Pesquisa

Linhas de Problemas de Pesquisa

Referências

Algoritmos otimizados de escalonamento para Kubernetes: Uma revisão sistemática da literatura

Área de Pesquisa

Objetivo da Pesquisa

Linhas de Problemas de Pesquisa

Referências

Planejamento de capacidade em ambientes de Computação em Nuvem: desafios, estratégias e tendências tecnológicas

Objetivo da Pesquisa

Área de Pesquisa

Linhas de Problemas de Pesquisa

Referências

Data Lakes como camada de integração centralizada para ambientes empresariais distribuídos e monolíticos

Área de Estudo

Engenharia de Dados; Integração de Aplicações; Arquitetura Empresarial.

Objetivo da Pesquisa

Investigar como a adoção de Data Lakes como camada de integração centralizada pode contribuir para a redução do acoplamento entre sistemas, melhoria da escalabilidade e governança dos dados, mitigando os desafios associados ao acesso direto a bases transacionais em arquiteturas empresariais complexas.

Linhas de Problemas de Pesquisa

Redução de acoplamento em arquiteturas híbridas
- Problema: Como a implementação de Data Lakes pode reduzir o acoplamento entre aplicações monolíticas e microsserviços, promovendo maior autonomia e escalabilidade?
- Justificativa: O acesso direto aos bancos transacionais cria dependências entre serviços, dificultando a evolução dos sistemas.
Eficiência e governança de dados em ambientes de alta carga
- Problema: Quais práticas de governança e controle de qualidade são eficazes para garantir a integridade e segurança dos dados em Data Lakes utilizados como camada de integração?
- Justificativa: A descentralização de acessos pode comprometer a segurança e integridade dos dados.
Desempenho de Consumo Multitemporal de Dados
- Problema: De que forma os mecanismos de consumo de dados (real-time, batch, histórico) impactam a performance e a latência das aplicações que acessam um Data Lake como fonte primária de integração?
- Justificativa: O uso de temporalidades distintas como diferencial estratégico, mas também como um desafio técnico.

Referências

Kreps, J., Narkhede, N., & Rao, J. (2011).
Kafka: A Distributed Messaging System for Log Processing.
In: Proceedings of the 6th ACM International Conference on Distributed Event-Based Systems.
[Apresenta fundamentos do streaming de dados, essencial para integração em tempo real.]
Hai, R., Geisler, S., & Jarke, M. (2016).
Data lake concept and systems: A survey.
In: Proceedings of the 11th International Conference on Advanced Information Systems Engineering (CAiSE).
[Explora os fundamentos técnicos e arquiteturais dos Data Lakes.]
Richardson, C. (2018).
Microservices Patterns: With examples in Java.
Manning Publications.
[Discute a relação entre acoplamento, governança e evolução de arquiteturas com foco em microsserviços.]
Hohpe, G., & Woolf, B. (2003).
Enterprise Integration Patterns: Designing, Building, and Deploying Messaging Solutions.
Addison-Wesley.
[Referência clássica para padrões de integração entre aplicações empresariais.]
Tsai, W., Bai, X., & Zhao, H. (2020).
Big Data Management Systems: Data Lakes and Data Warehouses.
[Aponta as diferenças, convergências e implicações de Data Lakes como infraestruturas centrais.]

Algoritmos otimizados de escalonamento para Kubernetes: Uma revisão sistemática da literatura

Área de Pesquisa

Computação em Nuvem; Engenharia de Software; Sistemas Distribuídos; Cloud Native.

Objetivo da Pesquisa

Analisar criticamente os algoritmos de escalonamento otimizados propostos na literatura para Kubernetes, com foco em sua aplicabilidade, benefícios e desafios em diferentes contextos de uso, como computação geral, inteligência artificial e edge computing.

Linhas de Problemas de Pesquisa

Eficiência de algoritmos otimizados em ambientes reais
- Problema: Como os algoritmos de escalonamento otimizados se comportam em ambientes de produção em comparação com os testes experimentais descritos na literatura?
- Justificativa: A maioria dos estudos analisados foi conduzida em ambientes controlados, e há lacuna quanto à aplicabilidade prática e à escalabilidade dos algoritmos.
Escalonamento multicritério para ambientes heterogêneos
- Problema: De que forma algoritmos multicritério podem melhorar a alocação de recursos em clusters heterogêneos (CPU/GPU, edge/cloud)?
- Justificativa: Mapeamento de abordagens que incluem variáveis como uso de GPU, latência de rede e consumo energético, mas a eficácia combinada ainda é incerta.
Integração de técnicas de aprendizado de máquina em algoritmos de escalonamento
- Problema: Quais modelos de aprendizado de máquina são mais eficazes na previsão de demanda e na adaptação dinâmica de escalonamento em clusters Kubernetes?
- Justificativa: Muitos estudos usam LSTM, PSO ou modelos genéticos, mas faltam comparações sistemáticas sobre qual abordagem entrega melhor QoS e custo-benefício.

Referências

Ahmed, G. et al. (2021).
KubCG: A dynamic Kubernetes scheduler for heterogeneous clusters.
Software: Practice and Experience, 51(2), 213–234.
https://onlinelibrary.wiley.com/doi/abs/10.1002/spe.2898
[Apresenta um agendador dinâmico que considera heterogeneidade de recursos, com foco em GPUs.]
Harichane, I.; Makhlouf, S. A.; Belalem, G. (2022).
KubeSC-RTP: Smart scheduler for Kubernetes platform on CPU-GPU heterogeneous systems.
Concurrency and Computation: Practice and Experience, 34(21), e7108.
https://doi.org/10.1002/cpe.7108
[Integra predição de tempo de execução para decidir uso de CPU vs GPU.]
Carvalho, M.; Macedo, D. F. (2023).
Container Scheduling in Co-Located Environments Using QoE Awareness.
IEEE Transactions on Network and Service Management, 20(3), 3247–3260.
https://doi.org/10.1109/TNSM.2023.3244090
[Explora uso de LSTM para maximizar QoE em ambientes co-localizados.]
Chiang, M.-C. et al. (2023).
Dynamic Resource Management for Machine Learning Pipeline Workloads.
SN Computer Science, 4(5).
https://doi.org/10.1007/s42979-023-02101-8
[Propõe HYPREL, que melhora throughput em até 60% em clusters ML distribuídos.]
Menouer, T. (2021).
KCSS: Kubernetes container scheduling strategy.
Journal of Supercomputing, 77(8), 4267–4293.
https://doi.org/10.1007/s11227-020-03427-3
[Algoritmo multicritério com foco em redução de makespan e consumo energético.]

Planejamento de capacidade em ambientes de Computação em Nuvem: desafios, estratégias e tendências tecnológicas

Objetivo da Pesquisa

Investigar modelos, abordagens e ferramentas para o planejamento de capacidade em ambientes de computação em nuvem, considerando diferentes perfis de carga de trabalho, variabilidade na demanda e os impactos de decisões de alocação de recursos na eficiência operacional e econômica dos sistemas.

Área de Pesquisa

Computação em Nuvem; Engenharia de Software; Sistemas Distribuídos; Planejamento de Capacidade.

Linhas de Problemas de Pesquisa

Modelos preditivos para planejamento de capacidade sob cargas variáveis
- Problema: Como modelos baseados em aprendizado de máquina podem prever flutuações de demanda e orientar decisões de provisionamento em tempo real?
- Justificativa: A variabilidade de workloads dificulta previsões estáveis, sendo uma das principais barreiras para o planejamento eficiente.
Impacto do overprovisioning e underprovisioning em estratégias de capacidade
- Problema: Quais são os impactos de decisões incorretas de alocação de recursos (over/underprovisioning) nos níveis de QoS e custo em ambientes multitenant?
- Justificativa: A má alocação de recursos gera desperdícios financeiros ou degradação de performance, e é destacada como desafio central no artigo.
Comparação entre estratégias estáticas e dinâmicas de Planejamento de Capacidade
- Problema: Em que cenários estratégias dinâmicas superam abordagens estáticas no planejamento de capacidade em cloud computing?
- Justificativa: Abordagens estáticas são limitadas em ambientes com alta variabilidade, mas carece de análise comparativa sistemática.

Referências

Islam, S., Keung, J., Lee, K., & Liu, A. (2012).
Empirical prediction models for adaptive resource provisioning in the cloud.
Future Generation Computer Systems, 28(1), 155–162.
https://doi.org/10.1016/j.future.2011.05.027
[Modelos empíricos preditivos aplicados ao planejamento de capacidade adaptativo.]
Wada, H., Suzuki, J., Yamano, Y., & Oba, K. (2011).
Evolutionary deployment optimization for service-oriented clouds.
Software: Practice and Experience, 41(5), 469–493.
https://doi.org/10.1002/spe.1028
[Otimização evolutiva aplicada à alocação de serviços em nuvem.]
Chen, H., Bahsoon, R., & Theodoropoulos, G. (2014).
Autonomic provisioning of backend databases in cloud systems.
In: IEEE Transactions on Services Computing, 7(4), 614–627.
https://doi.org/10.1109/TSC.2013.20
[Provisionamento automático com foco em backend e workloads variáveis.]
Menasce, D. A., & Bennani, M. N. (2006).
Autonomic virtualized environments.
In: Proceedings of the 2006 IEEE International Conference on Autonomic Computing.
https://doi.org/10.1109/ICAC.2006.1662391
[Discussão clássica sobre ambientes virtuais autônomos e planejamento.]
Chieu, T. C., Mohindra, A., Karve, A. A., & Segal, A. (2009).
Dynamic scaling of Web applications in a virtualized cloud computing environment.
In: IEEE International Conference on e-Business Engineering.
https://doi.org/10.1109/ICEBE.2009.61
[Aborda escalabilidade dinâmica com foco em aplicações web e planejamento de capacidade.]

Report abuse